忠实保留原有格式并翻译如下:
第 7 章 一阶线性方程组
许多物理问题涉及若干分离但相互关联的组成部分。例如,电路中的电流和电压、机械系统中的每个质量、化学系统中的每个元素(或化合物),或生物系统中的每个物种都具有这种特性。在这些及类似情况下,相应的数学问题由包含两个或多个微分方程的方程组构成,这些方程总可以写成一阶微分方程。在本章中,我们将重点讨论一阶线性微分方程组,特别是常系数微分方程,并利用线性代数的一些基本方面来统一表述。在许多方面,本章遵循了第 3 章处理二阶线性微分方程的相同思路。
7.1 引言
包含多个因变量(每个因变量都是同一自变量的函数)的问题自然会产生常微分方程组。我们将用 t t t 表示自变量,并让 x 1 , x 2 , x 3 , … x_{1}, x_{2}, x_{3}, \ldots x 1 , x 2 , x 3 , … 表示作为 t t t 的函数的因变量。对 t t t 的微分 1 { }^{1} 1 例如用 d x 1 d t \frac{d x_{1}}{d t} d t d x 1 或 x 1 ′ x_{1}^{\prime} x 1 ′ 表示。
让我们首先考虑图 7.1.1 中的弹簧-质量系统。两个质量在外部力 F 1 ( t ) F_{1}(t) F 1 ( t ) 和 F 2 ( t ) F_{2}(t) F 2 ( t ) 的作用下在无摩擦表面上移动,同时还受到三个弹簧的约束,弹簧常数分别为 k 1 k_{1} k 1 、k 2 k_{2} k 2 和 k 3 k_{3} k 3 。我们将向右的运动和位移视为正。
图 7.1.1 一个双质量、三弹簧系统。
使用与第 3.7 节类似的论证,我们得出两个质量坐标 x 1 x_{1} x 1 和 x 2 x_{2} x 2 的以下方程:
m 1 d 2 x 1 d t 2 = k 2 ( x 2 − x 1 ) − k 1 x 1 + F 1 ( t ) = − ( k 1 + k 2 ) x 1 + k 2 x 2 + F 1 ( t ) , m 2 d 2 x 2 d t 2 = − k 3 x 2 − k 2 ( x 2 − x 1 ) + F 2 ( t ) = k 2 x 1 − ( k 2 + k 3 ) x 2 + F 2 ( t ) . \begin{align*}
& m_{1} \frac{d^{2} x_{1}}{d t^{2}}=k_{2}\left(x_{2}-x_{1}\right)-k_{1} x_{1}+F_{1}(t)=-\left(k_{1}+k_{2}\right) x_{1}+k_{2} x_{2}+F_{1}(t), \\
& m_{2} \frac{d^{2} x_{2}}{d t^{2}}=-k_{3} x_{2}-k_{2}\left(x_{2}-x_{1}\right)+F_{2}(t)=k_{2} x_{1}-\left(k_{2}+k_{3}\right) x_{2}+F_{2}(t) . \tag{1}
\end{align*}
m 1 d t 2 d 2 x 1 = k 2 ( x 2 − x 1 ) − k 1 x 1 + F 1 ( t ) = − ( k 1 + k 2 ) x 1 + k 2 x 2 + F 1 ( t ) , m 2 d t 2 d 2 x 2 = − k 3 x 2 − k 2 ( x 2 − x 1 ) + F 2 ( t ) = k 2 x 1 − ( k 2 + k 3 ) x 2 + F 2 ( t ) . ( 1 )
有关微分方程组 (1) 的完整推导,请参见问题 14。
接下来,考虑图 7.1.2 所示的并联 L R C L R C L RC 电路。设 V V V 为电容器两端的电压降, I I I 为流过电感器的电流。然后,参考第 3.7 节和
[^0]本节的问题 16,我们可以证明电压和电流由以下方程组描述
d I d t = V L d V d t = − I C − V R C \begin{align*}
\frac{d I}{d t} & =\frac{V}{L} \\
\frac{d V}{d t} & =-\frac{I}{C}-\frac{V}{R C} \tag{2}
\end{align*}
d t d I d t d V = L V = − C I − RC V ( 2 )
其中 L L L 为电感, C C C 为电容, R R R 为电阻。
图 7.1.2 一个并联 L R C L R C L RC 电路。
一阶方程组之所以特别重要,一个原因在于高阶方程总可以转化为这样的方程组。如果计划采用数值方法,这通常是必需的,因为正如我们将在第 8 章中看到的那样,几乎所有用于生成微分方程数值近似解的代码都是为一阶方程组编写的。下面的例子说明了将二阶微分方程转化为由两个一阶微分方程组成的方程组是多么容易。
例 1
某个弹簧-质量系统(参见第 3.7 节的例 3)的运动由二阶微分方程
u ′ ′ + 1 8 u ′ + u = 0. \begin{equation*}
u^{\prime \prime}+\frac{1}{8} u^{\prime}+u=0 . \tag{3}
\end{equation*}
u ′′ + 8 1 u ′ + u = 0. ( 3 )
描述。
忠实地保持原有格式地翻译如下:
将这个方程重写为一个一阶方程组。
解:
令 x 1 = u x_{1}=u x 1 = u 且 x 2 = u ′ x_{2}=u^{\prime} x 2 = u ′ 。则可得 x 1 ′ = x 2 x_{1}^{\prime}=x_{2} x 1 ′ = x 2 。此外,u ′ ′ = x 2 ′ u^{\prime \prime}=x_{2}^{\prime} u ′′ = x 2 ′ 。然后,通过将 u u u 、u ′ u^{\prime} u ′ 和 u ′ ′ u^{\prime \prime} u ′′ 代入方程 (3),我们得到
x 2 ′ + 1 8 x 2 + x 1 = 0 。 x_{2}^{\prime}+\frac{1}{8} x_{2}+x_{1}=0 。
x 2 ′ + 8 1 x 2 + x 1 = 0 。
因此,x 1 x_{1} x 1 和 x 2 x_{2} x 2 满足以下由两个一阶微分方程组成的方程组:
x 1 ′ = x 2 x 2 ′ = − x 1 − 1 8 x 2 \begin{align*}
& x_{1}^{\prime}=x_{2} \\
& x_{2}^{\prime}=-x_{1}-\frac{1}{8} x_{2} \tag{4}
\end{align*}
x 1 ′ = x 2 x 2 ′ = − x 1 − 8 1 x 2 ( 4 )
弹簧-质量系统的通用运动方程
m u ′ ′ + γ u ′ + k u = F ( t ) \begin{equation*}
m u^{\prime \prime}+\gamma u^{\prime}+k u=F(t) \tag{5}
\end{equation*}
m u ′′ + γ u ′ + k u = F ( t ) ( 5 )
可以以同样的方式转化为一个一阶微分方程组。如果我们令 x 1 = u x_{1}=u x 1 = u 且 x 2 = u ′ x_{2}=u^{\prime} x 2 = u ′ ,并按照例 1 的步骤进行,我们很快就可以得到方程组
x 1 ′ = x 2 , x 2 ′ = − k m x 1 − γ m x 2 + 1 m F ( t ) \begin{align*}
& x_{1}^{\prime}=x_{2}, \\
& x_{2}^{\prime}=-\frac{k}{m} x_{1}-\frac{\gamma}{m} x_{2}+\frac{1}{m} F(t) \tag{6}
\end{align*}
x 1 ′ = x 2 , x 2 ′ = − m k x 1 − m γ x 2 + m 1 F ( t ) ( 6 )
为了将任意一个 n n n 阶方程
y ( n ) = F ( t , y , y ′ , … , y ( n − 1 ) ) \begin{equation*}
y^{(n)}=F\left(t, y, y^{\prime}, \ldots, y^{(n-1)}\right) \tag{7}
\end{equation*}
y ( n ) = F ( t , y , y ′ , … , y ( n − 1 ) ) ( 7 )
转化为一个由 n n n 个一阶微分方程组成的方程组,我们通过引入由下式定义的变量 x 1 , x 2 , … , x n x_{1}, x_{2}, \ldots, x_{n} x 1 , x 2 , … , x n 来扩展例 1 的方法:
x 1 = y , x 2 = y ′ , x 3 = y ′ ′ , … , x n = y ( n − 1 ) \begin{equation*}
x_{1}=y, \quad x_{2}=y^{\prime}, \quad x_{3}=y^{\prime \prime}, \ldots, \quad x_{n}=y^{(n-1)} \tag{8}
\end{equation*}
x 1 = y , x 2 = y ′ , x 3 = y ′′ , … , x n = y ( n − 1 ) ( 8 )
于是立即可以得出
x 1 ′ = x 2 x 2 ′ = x 3 ⋮ x n − 1 ′ = x n \begin{gather*}
x_{1}^{\prime}=x_{2} \\
x_{2}^{\prime}=x_{3} \tag{9}\\
\vdots \\
x_{n-1}^{\prime}=x_{n}
\end{gather*}
x 1 ′ = x 2 x 2 ′ = x 3 ⋮ x n − 1 ′ = x n ( 9 )
并且,根据方程 (7),
x n ′ = F ( t , x 1 , x 2 , … , x n ) 。 \begin{equation*}
x_{n}^{\prime}=F\left(t, x_{1}, x_{2}, \ldots, x_{n}\right) 。 \tag{10}
\end{equation*}
x n ′ = F ( t , x 1 , x 2 , … , x n ) 。 ( 10 )
方程 (9) 和 (10) 是更一般的方程组的一个特例
x 1 ′ = F 1 ( t , x 1 , x 2 , … , x n ) , x 2 ′ = F 2 ( t , x 1 , x 2 , … , x n ) , ⋮ x n ′ = F n ( t , x 1 , x 2 , … , x n ) 。 \begin{align*}
x_{1}^{\prime} & =F_{1}\left(t, x_{1}, x_{2}, \ldots, x_{n}\right), \\
x_{2}^{\prime} & =F_{2}\left(t, x_{1}, x_{2}, \ldots, x_{n}\right), \tag{11}\\
& \vdots \\
x_{n}^{\prime} & =F_{n}\left(t, x_{1}, x_{2}, \ldots, x_{n}\right) 。
\end{align*}
x 1 ′ x 2 ′ x n ′ = F 1 ( t , x 1 , x 2 , … , x n ) , = F 2 ( t , x 1 , x 2 , … , x n ) , ⋮ = F n ( t , x 1 , x 2 , … , x n ) 。 ( 11 )
类似地,方程组 (1) 可以化简为一个由四个形如 (11) 的一阶方程组成的方程组,而方程组 (2) 本身就已经是这种形式。事实上,形如 (11) 的方程组几乎包含了所有感兴趣的情况。微分方程的更高级理论很大一部分都致力于研究这类方程组。
方程组 (11) 在区间 I : α < t < β I: \alpha<t<\beta I : α < t < β 上的解由 n n n 个函数构成
x 1 = ϕ 1 ( t ) , x 2 = ϕ 2 ( t ) , … , x n = ϕ n ( t ) \begin{equation*}
x_{1}=\phi_{1}(t), x_{2}=\phi_{2}(t), \ldots, x_{n}=\phi_{n}(t) \tag{12}
\end{equation*}
x 1 = ϕ 1 ( t ) , x 2 = ϕ 2 ( t ) , … , x n = ϕ n ( t ) ( 12 )
其中每个函数都在区间 I I I 的所有点上可微,并且方程组 (11) 在区间 I I I 的所有点上都满足。除了给定的微分方程组之外,还可能给出形如以下的 n n n 个初始条件
x 1 ( t 0 ) = x 1 0 , x 2 ( t 0 ) = x 2 0 , … , x n ( t 0 ) = x n 0 \begin{equation*}
x_{1}\left(t_{0}\right)=x_{1}^{0}, \quad x_{2}\left(t_{0}\right)=x_{2}^{0}, \ldots, x_{n}\left(t_{0}\right)=x_{n}^{0} \tag{13}
\end{equation*}
x 1 ( t 0 ) = x 1 0 , x 2 ( t 0 ) = x 2 0 , … , x n ( t 0 ) = x n 0 ( 13 )
其中 t 0 t_{0} t 0 是区间 I I I 中指定的 t t t 值,x 1 0 , … , x n 0 x_{1}^{0}, \ldots, x_{n}^{0} x 1 0 , … , x n 0 是给定的数值。微分方程 (11) 和初始条件 (13) 一起构成一个初值问题。
好的,以下是将您提供的内容忠实地保持原有格式地翻译成准确的中文:
一族解 (12) 可被视为 n n n 维空间中的一组参数方程。对于给定的 t t t 值,方程组 (12) 给出空间中一点的坐标 x 1 , … , x n x_{1}, \ldots, x_{n} x 1 , … , x n 的值。随着 t t t 的变化,坐标通常也会变化。对应于 α < t < β \alpha<t<\beta α < t < β 的点的集合在空间中形成一条曲线。将该曲线视为按照微分方程组 (11) 运动的粒子的轨道或路径通常很有帮助。初始条件 (13) 确定运动粒子的起始点。当 n = 2 n=2 n = 2 且曲线位于 x 1 x 2 x_{1} x_{2} x 1 x 2 -平面时,这条曲线最易于可视化。
对于 F 1 , F 2 , … , F n F_{1}, F_{2}, \ldots, F_{n} F 1 , F 2 , … , F n 的以下条件很容易在具体问题中验证,它们足以确保初值问题 (11), (13) 具有唯一解。定理 7.1.1 类似于单一方程的欧拉方程的推广——定理 2.4.2,即存在唯一性定理。
定理 7.1.1
设 n n n 个函数 F 1 , … , F n F_{1}, \ldots, F_{n} F 1 , … , F n 和 n 2 n^{2} n 2 个一阶偏导数 ∂ F 1 ∂ x 1 , … , ∂ F 1 ∂ x n \frac{\partial F_{1}}{\partial x_{1}}, \ldots, \frac{\partial F_{1}}{\partial x_{n}} ∂ x 1 ∂ F 1 , … , ∂ x n ∂ F 1 , … , ∂ F n ∂ x 1 , … , ∂ F n ∂ x 1 \ldots, \frac{\partial F_{n}}{\partial x_{1}}, \ldots, \frac{\partial F_{n}}{\partial x_{1}} … , ∂ x 1 ∂ F n , … , ∂ x 1 ∂ F n 在由 α < t < β , α 1 < x 1 < β 1 , … , α n < x n < β n \alpha<t<\beta, \alpha_{1}<x_{1}<\beta_{1}, \ldots, \alpha_{n}<x_{n}<\beta_{n} α < t < β , α 1 < x 1 < β 1 , … , α n < x n < β n 定义的 t x 1 x 2 ⋯ x n t x_{1} x_{2} \cdots x_{n} t x 1 x 2 ⋯ x n -空间中的区域 R R R 内连续,并设点 ( t 0 , x 1 0 , x 2 0 , … , x n 0 ) \left(t_{0}, x_{1}^{0}, x_{2}^{0}, \ldots, x_{n}^{0}\right) ( t 0 , x 1 0 , x 2 0 , … , x n 0 ) 在 R R R 内。那么存在一个区间 ∣ t − t 0 ∣ < h \left|t-t_{0}\right|<h ∣ t − t 0 ∣ < h ,在该区间内存在微分方程组 (11) 的唯一解 x 1 = ϕ 1 ( t ) , … , x n = ϕ n ( t ) x_{1}=\phi_{1}(t), \ldots, x_{n}=\phi_{n}(t) x 1 = ϕ 1 ( t ) , … , x n = ϕ n ( t ) ,该解也满足初始条件 (13)。
该定理的证明可以通过推广第 2.8 节中的论证来构建,但我们在此不予给出。然而,请注意,在该定理的假设中,并未提及 F 1 , … , F n F_{1}, \ldots, F_{n} F 1 , … , F n 关于自变量 t t t 的偏导数。此外,在结论中,解存在的区间长度 2 h 2h 2 h 并未精确指定,并且在某些情况下可能非常短。最后,在一些较弱但更复杂的假设基础上也可以建立相同的结果,因此所陈述的定理不是已知的最一般形式,并且给出的条件是使结论成立的充分而非必要条件。
如果在方程组 (11) 中的每个函数 F 1 , … , F n F_{1}, \ldots, F_{n} F 1 , … , F n 是关于因变量 x 1 , … , x n x_{1}, \ldots, x_{n} x 1 , … , x n 的线性函数,则称该微分方程组是线性的;否则,它是非线性的。因此,由 n n n 个一阶线性微分方程组成的最一般系统具有以下形式:
x 1 ′ = p 11 ( t ) x 1 + ⋯ + p 1 n ( t ) x n + g 1 ( t ) , x 2 ′ = p 21 ( t ) x 1 + ⋯ + p 2 n ( t ) x n + g 2 ( t ) , ⋮ x n ′ = p n 1 ( t ) x 1 + ⋯ + p n n ( t ) x n + g n ( t ) . \begin{align*}
x_{1}^{\prime} & =p_{11}(t) x_{1}+\cdots+p_{1 n}(t) x_{n}+g_{1}(t), \\
x_{2}^{\prime} & =p_{21}(t) x_{1}+\cdots+p_{2 n}(t) x_{n}+g_{2}(t), \tag{14}\\
& \vdots \\
x_{n}^{\prime} & =p_{n 1}(t) x_{1}+\cdots+p_{n n}(t) x_{n}+g_{n}(t) .
\end{align*}
x 1 ′ x 2 ′ x n ′ = p 11 ( t ) x 1 + ⋯ + p 1 n ( t ) x n + g 1 ( t ) , = p 21 ( t ) x 1 + ⋯ + p 2 n ( t ) x n + g 2 ( t ) , ⋮ = p n 1 ( t ) x 1 + ⋯ + p nn ( t ) x n + g n ( t ) . ( 14 )
如果在区间 I I I 内所有 t t t 值,函数 g 1 ( t ) , … , g n ( t ) g_{1}(t), \ldots, g_{n}(t) g 1 ( t ) , … , g n ( t ) 都为零,则称系统 (14) 是齐次的;否则,它是非齐次的。注意,系统 (1) 和 (2) 都是线性的。系统 (1) 除非 F 1 ( t ) = F 2 ( t ) = 0 F_{1}(t)=F_{2}(t)=0 F 1 ( t ) = F 2 ( t ) = 0 ,否则是非齐次的,而系统 (2) 是齐次的。
对于线性系统 (14),存在唯一性定理更简单,并且具有更强的结论。它类似于定理 2.4.1 和 3.2.1。
定理 7.1.2
chinese
如果函数 p 11 , p 12 , … , p n n , g 1 , … , g n p_{11}, p_{12}, \ldots, p_{n n}, g_{1}, \ldots, g_{n} p 11 , p 12 , … , p nn , g 1 , … , g n 在开区间 I : α < t < β I: \alpha<t<\beta I : α < t < β 上连续,则系统 (14) 存在唯一解 x 1 = ϕ 1 ( t ) , … , x n = ϕ n ( t ) x_{1}=\phi_{1}(t), \ldots, x_{n}=\phi_{n}(t) x 1 = ϕ 1 ( t ) , … , x n = ϕ n ( t ) 也满足初始条件 (13),其中 t 0 t_{0} t 0 是 I I I 中的任意点,且 x 1 0 , … , x n 0 x_{1}^{0}, \ldots, x_{n}^{0} x 1 0 , … , x n 0 是任意给定的数值。此外,解在整个区间 I I I 上存在。
注意,与非线性系统的情况相比,线性系统解的存在性和唯一性在假设得到满足的整个区间上得到保证。此外,对于线性系统,在 t = t 0 t=t_{0} t = t 0 处的初始值 x 1 0 , … , x n 0 x_{1}^{0}, \ldots, x_{n}^{0} x 1 0 , … , x n 0 是完全任意的,然而在非线性情况下,初始点必须位于定理 7.1.1 中定义的区域 R R R 内。
本章的其余部分专门讨论线性一阶微分方程组(非线性系统包含在第 8 章和第 9 章的讨论中)。本讲解采用矩阵记号,并假设你对矩阵的性质有一定的了解。本讨论所需的关于矩阵的基本事实在 7.2 节和 7.3 节中介绍;一些更高级的材料在需要时在后面的章节中回顾。
7.2 矩阵
出于理论和计算两方面的考虑,最好将矩阵代数3 { }^{3} 3 的一些结果应用于线性微分方程组的初值问题。
[^2]本节和下一节简要概述了后面将会用到的一些事实。更详细的内容可以在任何基础的线性代数书籍中找到。然而,我们假设您熟悉行列式及其计算方法。
我们用黑体大写字母 A , B , C , … \mathbf{A}, \mathbf{B}, \mathbf{C}, \ldots A , B , C , … 来表示矩阵,偶尔也使用黑体希腊字母 Φ , Ψ , … \boldsymbol{\Phi}, \mathbf{\Psi}, \ldots Φ , Ψ , … 。矩阵 A \mathbf{A} A 由一个矩形数组组成,数组包含按 m m m 行 n n n 列排列的数或元素,即
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n ) (1) \mathbf{A}=\left(\begin{array}{cccc}
a_{11} & a_{12} & \cdots & a_{1 n} \tag{1}\\
a_{21} & a_{22} & \cdots & a_{2 n} \\
\vdots & \vdots & & \vdots \\
a_{m 1} & a_{m 2} & \cdots & a_{m n}
\end{array}\right)
A = a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a mn ( 1 )
我们将 A \mathbf{A} A 称为一个 m × n \mathbf{m} \times \mathbf{n} m × n 矩阵。尽管在本章后面我们常常假设某些矩阵的元素是实数,但在本节中,我们允许矩阵的元素是复数。位于第 i i i 行第 j j j 列的元素记作 a i j a_{i j} a ij ,第一个下标表示行,第二个下标表示列。有时使用记号 ( a i j ) \left(a_{i j}\right) ( a ij ) 来表示其一般元素为 a i j a_{i j} a ij 的矩阵。
与每个矩阵 A \mathbf{A} A 相关联的是矩阵 A T \mathbf{A}^{T} A T ,它被称为 A \mathbf{A} A 的转置,是通过交换 A \mathbf{A} A 的行和列得到的。因此,如果 A = ( a i j ) \mathbf{A}=\left(a_{i j}\right) A = ( a ij ) ,那么 A T = ( a j i ) \mathbf{A}^{T}=\left(a_{j i}\right) A T = ( a ji ) 。此外,我们将用 a i j ‾ \overline{a_{i j}} a ij 表示 a i j a_{i j} a ij 的复共轭,用 A ‾ \overline{\mathbf{A}} A 表示将 A \mathbf{A} A 中的每个元素 a i j a_{i j} a ij 替换为其共轭 a i j ‾ \overline{a_{i j}} a ij 后得到的矩阵。矩阵 A ‾ \overline{\mathbf{A}} A 称为 A \mathbf{A} A 的共轭。还需要考虑共轭矩阵 A ‾ T \overline{\mathbf{A}}^{T} A T 的转置。这个矩阵称为 A \mathbf{A} A 的伴随矩阵,将用 A ∗ \mathbf{A}^{*} A ∗ 表示。
例如,令
A = ( 3 2 − i 4 + 3 i − 5 + 2 i ) \mathbf{A}=\left(\begin{array}{cc}
3 & 2-i \\
4+3 i & -5+2 i
\end{array}\right)
A = ( 3 4 + 3 i 2 − i − 5 + 2 i )
则
A T = ( 3 4 + 3 i 2 − i − 5 + 2 i ) , A ‾ = ( 3 2 + i 4 − 3 i − 5 − 2 i ) , A ∗ = ( 3 4 − 3 i 2 + i − 5 − 2 i ) \begin{gathered}
\mathbf{A}^{T}=\left(\begin{array}{cc}
3 & 4+3 i \\
2-i & -5+2 i
\end{array}\right), \quad \overline{\mathbf{A}}=\left(\begin{array}{cc}
3 & 2+i \\
4-3 i & -5-2 i
\end{array}\right), \\
\mathbf{A}^{*}=\left(\begin{array}{cc}
3 & 4-3 i \\
2+i & -5-2 i
\end{array}\right)
\end{gathered}
A T = ( 3 2 − i 4 + 3 i − 5 + 2 i ) , A = ( 3 4 − 3 i 2 + i − 5 − 2 i ) , A ∗ = ( 3 2 + i 4 − 3 i − 5 − 2 i )
我们对两种较为特殊的矩阵特别感兴趣:方阵,其行数和列数相等,即 m = n m=n m = n ;以及向量(或列向量),可以看作是 n × 1 n \times 1 n × 1 矩阵,或只有一列的矩阵。具有 n n n 行 n n n 列的方阵称为 n n n 阶方阵。我们用黑体小写字母表示(列)向量:x , y , ξ , η , … \mathbf{x}, \mathbf{y}, \boldsymbol{\xi}, \boldsymbol{\eta}, \ldots x , y , ξ , η , … 。 n × 1 n \times 1 n × 1 列向量的转置 x T \mathbf{x}^{T} x T 是一个 1 × n 1 \times n 1 × n 行向量,即由一行组成的矩阵,其元素与 x \mathbf{x} x 中对应位置的元素相同。
矩阵的性质.
相等。当两个 m × n m \times n m × n 矩阵 A \mathbf{A} A 和 B \mathbf{B} B 的所有对应元素都相等时,称它们相等,即对每个 i i i 和 j j j ,都有 a i j = b i j a_{i j}=b_{i j} a ij = b ij 。
零。符号 0 \mathbf{0} 0 将用来表示其所有元素均为零的矩阵(或向量)。
加法。两个 m × n m \times n m × n 矩阵 A \mathbf{A} A 和 B \mathbf{B} B 的和定义为将对应元素相加后得到的矩阵:
好的,以下是将您提供的内容忠实地保留原有格式翻译成中文的结果:
A + B = ( a i j ) + ( b i j ) = ( a i j + b i j ) . \begin{equation*}
\mathbf{A}+\mathbf{B}=\left(a_{i j}\right)+\left(b_{i j}\right)=\left(a_{i j}+b_{i j}\right) . \tag{2}
\end{equation*}
A + B = ( a ij ) + ( b ij ) = ( a ij + b ij ) . ( 2 )
根据此定义,矩阵加法满足交换律和结合律,因此有
A + B = B + A , A + ( B + C ) = ( A + B ) + C . \begin{equation*}
\mathbf{A}+\mathbf{B}=\mathbf{B}+\mathbf{A}, \quad \mathbf{A}+(\mathbf{B}+\mathbf{C})=(\mathbf{A}+\mathbf{B})+\mathbf{C} . \tag{3}
\end{equation*}
A + B = B + A , A + ( B + C ) = ( A + B ) + C . ( 3 )
数乘。矩阵 A \mathbf{A} A 与一个实数或复数 α \alpha α 的乘积定义如下:
α A = α ( a i j ) = ( α a i j ) \begin{equation*}
\alpha \mathbf{A}=\alpha\left(a_{i j}\right)=\left(\alpha a_{i j}\right) \tag{4}
\end{equation*}
α A = α ( a ij ) = ( α a ij ) ( 4 )
也就是说,A \mathbf{A} A 的每个元素都乘以 α \alpha α 。对于这种乘法,分配律成立:
α ( A + B ) = α A + α B , ( α + β ) A = α A + β A \begin{equation*}
\alpha(\mathbf{A}+\mathbf{B})=\alpha \mathbf{A}+\alpha \mathbf{B}, \quad(\alpha+\beta) \mathbf{A}=\alpha \mathbf{A}+\beta \mathbf{A} \tag{5}
\end{equation*}
α ( A + B ) = α A + α B , ( α + β ) A = α A + β A ( 5 )
特别地,A \mathbf{A} A 的负矩阵,记为 − A -\mathbf{A} − A ,定义为
− A = ( − 1 ) A \begin{equation*}
-\mathbf{A}=(-1) \mathbf{A} \tag{6}
\end{equation*}
− A = ( − 1 ) A ( 6 )
减法。两个 m × n m \times n m × n 矩阵的差 A − B \mathbf{A}-\mathbf{B} A − B 定义为
A − B = A + ( − B ) \begin{equation*}
\mathbf{A}-\mathbf{B}=\mathbf{A}+(-\mathbf{B}) \tag{7}
\end{equation*}
A − B = A + ( − B ) ( 7 )
因此
A − B = ( a i j ) − ( b i j ) = ( a i j − b i j ) \begin{equation*}
\mathbf{A}-\mathbf{B}=\left(a_{i j}\right)-\left(b_{i j}\right)=\left(a_{i j}-b_{i j}\right) \tag{8}
\end{equation*}
A − B = ( a ij ) − ( b ij ) = ( a ij − b ij ) ( 8 )
乘法。只有当第一个因子(矩阵)的列数与第二个因子(矩阵)的行数相同时,两个矩阵的乘积 A B \mathbf{A B} AB 才被定义。如果 A \mathbf{A} A 是一个 m × n m \times n m × n 矩阵,B \mathbf{B} B 是一个 n × r n \times r n × r 矩阵,那么乘积 C = A B \mathbf{C}=\mathbf{A B} C = AB 是一个 m × r m \times r m × r 矩阵。C \mathbf{C} C 的第 i i i 行第 j j j 列的元素是通过将 A \mathbf{A} A 的第 i i i 行的每个元素与 B \mathbf{B} B 的第 j j j 列的对应元素相乘,然后将所得的乘积相加得到的。用符号表示为,
c i j = ∑ k = 1 n a i k b k j . \begin{equation*}
c_{i j}=\sum_{k=1}^{n} a_{i k} b_{k j} . \tag{9}
\end{equation*}
c ij = k = 1 ∑ n a ik b kj . ( 9 )
通过直接计算可知,矩阵乘法满足结合律
( A B ) C = A ( B C ) \begin{equation*}
(\mathbf{A B}) \mathbf{C}=\mathbf{A}(\mathbf{B C}) \tag{10}
\end{equation*}
( AB ) C = A ( BC ) ( 10 )
和分配律
A ( B + C ) = A B + A C \begin{equation*}
\mathbf{A}(\mathbf{B}+\mathbf{C})=\mathbf{A B}+\mathbf{A} \mathbf{C} \tag{11}
\end{equation*}
A ( B + C ) = AB + AC ( 11 )
然而,一般而言,矩阵乘法不满足交换律。要使乘积 A B \mathbf{A B} AB 和 B A \mathbf{B A} BA 都存在且尺寸相同,必须要求 A \mathbf{A} A 和 B \mathbf{B} B 是同阶方阵。即使在这种情况下,两个乘积通常也不相等。一般而言,
A B ≠ B A . \begin{equation*}
\mathbf{A B} \neq \mathbf{B A} . \tag{12}
\end{equation*}
AB = BA . ( 12 )
示例 1
为了说明矩阵乘法,同时说明矩阵乘法不一定满足交换律,考虑矩阵
A = ( 1 − 2 1 0 2 − 1 2 1 1 ) , B = ( 2 1 − 1 1 − 1 0 2 − 1 1 ) \mathbf{A}=\left(\begin{array}{rrr}
1 & -2 & 1 \\
0 & 2 & -1 \\
2 & 1 & 1
\end{array}\right), \quad \mathbf{B}=\left(\begin{array}{rrr}
2 & 1 & -1 \\
1 & -1 & 0 \\
2 & -1 & 1
\end{array}\right)
A = 1 0 2 − 2 2 1 1 − 1 1 , B = 2 1 2 1 − 1 − 1 − 1 0 1
解:
根据方程 (9) 中给出的乘法定义,我们有
A B = ( 2 − 2 + 2 1 + 2 − 1 − 1 + 0 + 1 0 + 2 − 2 0 − 2 + 1 0 + 0 − 1 4 + 1 + 2 2 − 1 − 1 − 2 + 0 + 1 ) = ( 2 2 0 0 − 1 − 1 7 0 − 1 ) . \begin{aligned}
\mathbf{A B} & =\left(\begin{array}{rrr}
2-2+2 & 1+2-1 & -1+0+1 \\
0+2-2 & 0-2+1 & 0+0-1 \\
4+1+2 & 2-1-1 & -2+0+1
\end{array}\right) \\
& =\left(\begin{array}{rrr}
2 & 2 & 0 \\
0 & -1 & -1 \\
7 & 0 & -1
\end{array}\right) .
\end{aligned}
AB = 2 − 2 + 2 0 + 2 − 2 4 + 1 + 2 1 + 2 − 1 0 − 2 + 1 2 − 1 − 1 − 1 + 0 + 1 0 + 0 − 1 − 2 + 0 + 1 = 2 0 7 2 − 1 0 0 − 1 − 1 .
类似地,我们发现
B A = ( 0 − 3 0 1 − 4 2 4 − 5 4 ) \mathbf{B A}=\left(\begin{array}{lll}
0 & -3 & 0 \\
1 & -4 & 2 \\
4 & -5 & 4
\end{array}\right)
BA = 0 1 4 − 3 − 4 − 5 0 2 4
显然,A B ≠ B A \mathbf{A B} \neq \mathbf{B A} AB = BA 。
7. 向量乘法。形成两个向量 x \mathbf{x} x 和 y \mathbf{y} y 的乘积有几种方式,每个向量都有 n n n 个分量。其中一种是将物理学和微积分中熟悉的点积直接推广到 n n n 维;我们将其记为 x T y \mathbf{x}^{T} \mathbf{y} x T y ,并写为
x T y = ∑ i = 1 n x i y i \begin{equation*}
\mathbf{x}^{T} \mathbf{y}=\sum_{i=1}^{n} x_{i} y_{i} \tag{13}
\end{equation*}
x T y = i = 1 ∑ n x i y i ( 13 )
方程 (13) 的结果是一个实数或复数,并且直接从方程 (13) 可知
x T y = y T x , x T ( y + z ) = x T y + x T z , ( α x ) T y = α ( x T y ) = x T ( α y ) \begin{equation*}
\mathbf{x}^{T} \mathbf{y}=\mathbf{y}^{T} \mathbf{x}, \quad \mathbf{x}^{T}(\mathbf{y}+\mathbf{z})=\mathbf{x}^{T} \mathbf{y}+\mathbf{x}^{T} \mathbf{z}, \quad(\alpha \mathbf{x})^{T} \mathbf{y}=\alpha\left(\mathbf{x}^{T} \mathbf{y}\right)=\mathbf{x}^{T}(\alpha \mathbf{y}) \tag{14}
\end{equation*}
x T y = y T x , x T ( y + z ) = x T y + x T z , ( α x ) T y = α ( x T y ) = x T ( α y ) ( 14 )
还有另一种向量乘积,它也为具有相同分量数的任意两个向量定义。这种乘积记为 ( x , y ) (\mathbf{x}, \mathbf{y}) ( x , y ) ,称为标量积或内积,其定义为
( x , y ) = ∑ i = 1 n x i y ˉ i . \begin{equation*}
(\mathbf{x}, \mathbf{y})=\sum_{i=1}^{n} x_{i} \bar{y}_{i} . \tag{15}
\end{equation*}
( x , y ) = i = 1 ∑ n x i y ˉ i . ( 15 )
标量积也是一个实数或复数,通过比较方程 (13) 和 (15),我们可以看到它们之间的关系:
( x , y ) = x T y ‾ \begin{equation*}
(\mathbf{x}, \mathbf{y})=\mathbf{x}^{T} \overline{\mathbf{y}} \tag{16}
\end{equation*}
( x , y ) = x T y ( 16 )
因此,如果 y \mathbf{y} y 的所有元素都是实数,则这两种乘积 (13) 和 (15) 是相同的。从方程 (15) 可知
( x , y ) = ( y , x ) ‾ , ( x , y + z ) = ( x , y ) + ( x , z ) ( α x , y ) = α ( x , y ) , ( x , α y ) = α ˉ ( x , y ) . \begin{align*}
(\mathbf{x}, \mathbf{y}) & =\overline{(\mathbf{y}, \mathbf{x})}, & (\mathbf{x}, \mathbf{y}+\mathbf{z}) & =(\mathbf{x}, \mathbf{y})+(\mathbf{x}, \mathbf{z}) \tag{17}\\
(\alpha \mathbf{x}, \mathbf{y}) & =\alpha(\mathbf{x}, \mathbf{y}), & (\mathbf{x}, \alpha \mathbf{y}) & =\bar{\alpha}(\mathbf{x}, \mathbf{y}) .
\end{align*}
( x , y ) ( α x , y ) = ( y , x ) , = α ( x , y ) , ( x , y + z ) ( x , α y ) = ( x , y ) + ( x , z ) = α ˉ ( x , y ) . ( 17 )
注意,即使向量 x \mathbf{x} x 的元素具有非零虚部,向量 x \mathbf{x} x 与自身的标量积也会得到一个非负实数
( x , x ) = ∑ i = 1 n x i x ˉ i = ∑ i = 1 n ∣ x i ∣ 2 \begin{equation*}
(\mathbf{x}, \mathbf{x})=\sum_{i=1}^{n} x_{i} \bar{x}_{i}=\sum_{i=1}^{n}\left|x_{i}\right|^{2} \tag{18}
\end{equation*}
( x , x ) = i = 1 ∑ n x i x ˉ i = i = 1 ∑ n ∣ x i ∣ 2 ( 18 )
非负量 ( x , x ) 1 / 2 (\mathbf{x}, \mathbf{x})^{1 / 2} ( x , x ) 1/2 ,通常记为 ∥ x ∥ \|\mathbf{x}\| ∥ x ∥ ,称为 x \mathbf{x} x 的长度或模长。唯一的长度为零的向量 x \mathbf{x} x ,即 ( x , x ) = 0 (\mathbf{x}, \mathbf{x})=\mathbf{0} ( x , x ) = 0 ,是零向量 x = 0 \mathbf{x}=\mathbf{0} x = 0 ;所有其他向量都有正长度。如果 ( x , y ) = 0 (\mathbf{x}, \mathbf{y})=0 ( x , y ) = 0 ,则称这两个向量 x \mathbf{x} x 和 y \mathbf{y} y 是正交的。例如,三维向量几何中的单位向量 i , j , k \mathbf{i}, \mathbf{j}, \mathbf{k} i , j , k 构成一个正交集。另一方面,如果 x \mathbf{x} x 的某些元素不是实数,则乘积
x T x = ∑ i = 1 n x i 2 \begin{equation*}
\mathbf{x}^{T} \mathbf{x}=\sum_{i=1}^{n} x_{i}^{2} \tag{19}
\end{equation*}
x T x = i = 1 ∑ n x i 2 ( 19 )
可能不是一个实数。此外,对于某些非零向量,x T x \mathbf{x}^{T} \mathbf{x} x T x 可以为零。
例如,令
x = ( i − 2 1 + i ) , y = ( 2 − i i 3 ) and z = ( 1 0 i ) \mathbf{x}=\left(\begin{array}{c}
i \\
-2 \\
1+i
\end{array}\right), \quad \mathbf{y}=\left(\begin{array}{c}
2-i \\
i \\
3
\end{array}\right) \quad \text { and } \mathbf{z}=\left(\begin{array}{c}
1 \\
0 \\
i
\end{array}\right)
x = i − 2 1 + i , y = 2 − i i 3 and z = 1 0 i
则
x T y = ( i ) ( 2 − i ) + ( − 2 ) ( i ) + ( 1 + i ) ( 3 ) = 4 + 3 i , ( x , y ) = ( i ) ( 2 + i ) + ( − 2 ) ( − i ) + ( 1 + i ) ( 3 ) = 2 + 7 i , x T x = ( i ) 2 + ( − 2 ) 2 + ( 1 + i ) 2 = 3 + 2 i , ( x , x ) = ( i ) ( − i ) + ( − 2 ) ( − 2 ) + ( 1 + i ) ( 1 − i ) = 7 , z T z = ( 1 ) ( 1 ) + ( 0 ) ( 0 ) + ( i ) ( i ) = 1 + 0 − 1 = 0 , ( z , z ) = ( 1 ) ( 1 ) + ( 0 ) ( 0 ) + ( i ) ( − i ) = 1 + 0 + 1 = 2. \begin{aligned}
\mathbf{x}^{T} \mathbf{y} & =(i)(2-i)+(-2)(i)+(1+i)(3)=4+3 i, \\
(\mathbf{x}, \mathbf{y}) & =(i)(2+i)+(-2)(-i)+(1+i)(3)=2+7 i, \\
\mathbf{x}^{T} \mathbf{x} & =(i)^{2}+(-2)^{2}+(1+i)^{2}=3+2 i, \\
(\mathbf{x}, \mathbf{x}) & =(i)(-i)+(-2)(-2)+(1+i)(1-i)=7, \\
\mathbf{z}^{T} \mathbf{z} & =(1)(1)+(0)(0)+(i)(i)=1+0-1=0, \\
(\mathbf{z}, \mathbf{z}) & =(1)(1)+(0)(0)+(i)(-i)=1+0+1=2 .
\end{aligned}
x T y ( x , y ) x T x ( x , x ) z T z ( z , z ) = ( i ) ( 2 − i ) + ( − 2 ) ( i ) + ( 1 + i ) ( 3 ) = 4 + 3 i , = ( i ) ( 2 + i ) + ( − 2 ) ( − i ) + ( 1 + i ) ( 3 ) = 2 + 7 i , = ( i ) 2 + ( − 2 ) 2 + ( 1 + i ) 2 = 3 + 2 i , = ( i ) ( − i ) + ( − 2 ) ( − 2 ) + ( 1 + i ) ( 1 − i ) = 7 , = ( 1 ) ( 1 ) + ( 0 ) ( 0 ) + ( i ) ( i ) = 1 + 0 − 1 = 0 , = ( 1 ) ( 1 ) + ( 0 ) ( 0 ) + ( i ) ( − i ) = 1 + 0 + 1 = 2.
单位矩阵。n × n n \times n n × n 乘法单位元,或简称 n × n n \times n n × n 单位矩阵 I \mathbf{I} I ,给出如下
chinese
I = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 1 ) } n 行。 (20) \left.\mathbf{I}=\left(\begin{array}{cccc}
1 & 0 & \cdots & 0 \tag{20}\\
0 & 1 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & 1
\end{array}\right)\right\} n \text { 行。 }
I = 1 0 ⋮ 0 0 1 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ 1 ⎭ ⎬ ⎫ n 行。 ( 20 )
根据矩阵乘法的定义,我们有
A I = I A = A \begin{equation*}
\mathbf{A I}=\mathbf{I} \mathbf{A}=\mathbf{A} \tag{21}
\end{equation*}
AI = IA = A ( 21 )
对于任何(方)矩阵 A \mathbf{A} A 。因此,如果其中一个矩阵是单位矩阵,则方矩阵的乘法满足交换律。
9. 逆矩阵与行列式。如果存在另一个矩阵 B \mathbf{B} B 使得 A B = I \mathbf{A B}=\mathbf{I} AB = I 且 B A = I \mathbf{B A}=\mathbf{I} BA = I ,其中 I \mathbf{I} I 是 n × n n \times n n × n 单位矩阵,则称 n × n n \times n n × n 方矩阵 A \mathbf{A} A 是非奇异的或可逆的。如果存在这样的 B \mathbf{B} B ,可以证明它是唯一的。它被称为 A \mathbf{A} A 的乘法逆矩阵,或简称逆矩阵,我们记为 B = A − 1 \mathbf{B}=\mathbf{A}^{-1} B = A − 1 。于是,
A A − 1 = A − 1 A = I \begin{equation*}
\mathbf{A} \mathbf{A}^{-1}=\mathbf{A}^{-1} \mathbf{A}=\mathbf{I} \tag{22}
\end{equation*}
A A − 1 = A − 1 A = I ( 22 )
没有逆矩阵的矩阵称为奇异的或不可逆的。
假设 A − 1 \mathbf{A}^{-1} A − 1 存在,有多种方法可以从 A \mathbf{A} A 计算它。一种方法涉及使用行列式。与给定矩阵的每个元素 a i j a_{i j} a ij 相关的,是其余子式 M i j M_{i j} M ij ,它是通过删除原矩阵中包含 a i j a_{i j} a ij 的第 i i i 行和第 j j j 列所得到的矩阵的行列式。与每个元素 a i j a_{i j} a ij 相关的还有代数余子式 C i j C_{i j} C ij ,其定义方程为
C i j = ( − 1 ) i + j M i j \begin{equation*}
C_{i j}=(-1)^{i+j} M_{i j} \tag{23}
\end{equation*}
C ij = ( − 1 ) i + j M ij ( 23 )
A \mathbf{A} A 的行列式,记为 det A \operatorname{det} \mathbf{A} det A ,可以通过沿 A \mathbf{A} A 的任何行或列的代数余子式之和来求得。例如,沿第一行展开得到的公式为
det A = C 11 + C 12 + ⋯ + C 1 n \operatorname{det} \mathbf{A}=C_{11}+C_{12}+\cdots+C_{1 n}
det A = C 11 + C 12 + ⋯ + C 1 n
当 det A ≠ 0 \operatorname{det} \mathbf{A} \neq 0 det A = 0 时,A \mathbf{A} A 是非奇异的且 A − 1 \mathbf{A}^{-1} A − 1 存在。如果我们记 B = A − 1 \mathbf{B}=\mathbf{A}^{-1} B = A − 1 ,则可以证明其一般元素 b i j b_{i j} b ij 由下式给出:
b i j = C j i det A \begin{equation*}
b_{i j}=\frac{C_{j i}}{\operatorname{det} \mathbf{A}} \tag{24}
\end{equation*}
b ij = det A C ji ( 24 )
尽管公式 (24) 不是计算 A − 1 \mathbf{A}^{-1} A − 1 的一种有效方法 4 { }^{4} 4 ,但它确实指出了 A \mathbf{A} A 必须满足的具有逆矩阵的条件。事实上,该条件既是必要的,也是
[^3]充分的:A \mathbf{A} A 是非奇异的当且仅当 det A ≠ 0 \operatorname{det} \mathbf{A} \neq 0 det A = 0 。等价地,A \mathbf{A} A 是奇异的当且仅当 det A = 0 \operatorname{det} \mathbf{A}=0 det A = 0 。
另一种(通常更好的)计算 A − 1 \mathbf{A}^{-1} A − 1 的方法是利用初等行变换。共有三种这样的运算:
交换两行。
用非零标量乘以一行。
将一行的任意倍数加到另一行。
通过一系列初等行变换对矩阵进行的变换称为行约化或高斯 5 { }^{5} 5 消元法。任何非奇异矩阵 A \mathbf{A} A 都可以通过系统地运用这些运算序列变换为单位矩阵 I \mathbf{I} I 。可以证明,如果在 I \mathbf{I} I 上进行相同的运算序列,则它被变换为 A − 1 \mathbf{A}^{-1} A − 1 。最有效的方法是同时对两个矩阵进行该运算序列,方法是构成增广矩阵 ( A ∣ I ) (\mathbf{A} \mid \mathbf{I}) ( A ∣ I ) 。以下示例说明了用这种方法计算逆矩阵。
示例 2
求以下矩阵的逆矩阵:
A = ( 1 − 1 − 1 3 − 1 2 2 2 3 ) \mathbf{A}=\left(\begin{array}{rrr}
1 & -1 & -1 \\
3 & -1 & 2 \\
2 & 2 & 3
\end{array}\right)
A = 1 3 2 − 1 − 1 2 − 1 2 3
解:
求 A − 1 \mathbf{A}^{-1} A − 1 的第一步是构成增广矩阵 ( A ∣ I ) (\mathbf{A} \mid \mathbf{I}) ( A ∣ I ) :
( 1 − 1 − 1 1 0 0 3 − 1 2 0 1 0 2 2 3 0 0 1 ) \left(\begin{array}{rrr|rrr}
1 & -1 & -1 & 1 & 0 & 0 \\
3 & -1 & 2 & 0 & 1 & 0 \\
2 & 2 & 3 & 0 & 0 & 1
\end{array}\right)
1 3 2 − 1 − 1 2 − 1 2 3 1 0 0 0 1 0 0 0 1
好的,以下是将原文忠实地保持原有格式翻译成准确的中文:
( A ∣ I ) = ( 1 − 1 − 1 1 0 0 3 − 1 2 0 1 0 2 2 3 0 0 1 ) . (\mathbf{A} \mid \mathbf{I})=\left(\begin{array}{rrr|rrr}
1 & -1 & -1 & 1 & 0 & 0 \\
3 & -1 & 2 & 0 & 1 & 0 \\
2 & 2 & 3 & 0 & 0 & 1
\end{array}\right) .
( A ∣ I ) = 1 3 2 − 1 − 1 2 − 1 2 3 1 0 0 0 1 0 0 0 1 .
竖线是一个视觉提示,表明这个 3 × 6 3 \times 6 3 × 6 矩阵是由两个 3 × 3 3 \times 3 3 × 3 矩阵组成的。矩阵 A 可以通过以下一系列运算变换成 I,同时 I 被变换成 A − 1 \mathbf{A}^{-1} A − 1 。每一步的结果都显示在说明下方。
(a) 通过将第一行的 (-3) 倍加到第二行,以及将第一行的 (-2) 倍加到第三行,在第一列的非对角线位置(阴影部分)得到零。
( 1 − 1 − 1 1 0 0 0 2 5 − 3 1 0 0 4 5 − 2 0 1 ) \left(\begin{array}{rrr|rrr}
1 & -1 & -1 & 1 & 0 & 0 \\
0 & 2 & 5 & -3 & 1 & 0 \\
0 & 4 & 5 & -2 & 0 & 1
\end{array}\right)
1 0 0 − 1 2 4 − 1 5 5 1 − 3 − 2 0 1 0 0 0 1
(b) 通过将第二行乘以 1 2 \frac{1}{2} 2 1 ,在第二列的对角线位置(阴影部分)得到 1。
( 1 − 1 − 1 1 0 0 0 1 5 2 − 3 2 1 2 0 0 4 5 − 2 0 1 ) \left(\begin{array}{rrr|rrr}
1 & -1 & -1 & 1 & 0 & 0 \\
0 & 1 & \frac{5}{2} & -\frac{3}{2} & \frac{1}{2} & 0 \\
0 & 4 & 5 & -2 & 0 & 1
\end{array}\right)
1 0 0 − 1 1 4 − 1 2 5 5 1 − 2 3 − 2 0 2 1 0 0 0 1
⁵ 卡尔·弗里德里希·高斯 (1777-1855) 出生于不伦瑞克(德国),大部分时间在哥廷根大学担任天文学教授和天文台台长。高斯对数学的许多领域做出了重大贡献,包括数论、代数、非欧几里得几何和微分几何、以及分析,还包括大地测量学、统计学和天体力学等更应用领域的贡献。他通常被认为是所有时代最杰出的六位数学家之一。
(c) 通过将第二行加到第一行,以及将第二行的 (-4) 倍加到第三行,在第二列的非对角线位置(阴影部分)得到零。
( 1 0 3 2 − 1 2 1 2 0 0 1 5 2 − 3 2 1 2 0 0 0 − 5 4 − 2 1 ) \left(\begin{array}{rrr|rrr}
1 & 0 & \frac{3}{2} & -\frac{1}{2} & \frac{1}{2} & 0 \\
0 & 1 & \frac{5}{2} & -\frac{3}{2} & \frac{1}{2} & 0 \\
0 & 0 & -5 & 4 & -2 & 1
\end{array}\right)
1 0 0 0 1 0 2 3 2 5 − 5 − 2 1 − 2 3 4 2 1 2 1 − 2 0 0 1
(d) 通过将第三行乘以 − 1 5 -\frac{1}{5} − 5 1 ,在第三列的对角线位置(阴影部分)得到 1。
( 1 0 3 2 − 1 2 1 2 0 0 1 5 2 − 3 2 1 2 0 0 0 1 − 4 5 2 5 − 1 5 ) \left(\begin{array}{lll|rrr}
1 & 0 & \frac{3}{2} & -\frac{1}{2} & \frac{1}{2} & 0 \\
0 & 1 & \frac{5}{2} & -\frac{3}{2} & \frac{1}{2} & 0 \\
0 & 0 & 1 & -\frac{4}{5} & \frac{2}{5} & -\frac{1}{5}
\end{array}\right)
1 0 0 0 1 0 2 3 2 5 1 − 2 1 − 2 3 − 5 4 2 1 2 1 5 2 0 0 − 5 1
(e) 通过将第三行的 ( − 3 2 ) \left(-\frac{3}{2}\right) ( − 2 3 ) 倍加到第一行,以及将第三行的 ( − 5 2 ) \left(-\frac{5}{2}\right) ( − 2 5 ) 倍加到第二行,在第三列的非对角线位置(阴影部分)得到零。
( 1 0 0 7 10 − 1 10 3 10 0 1 0 1 2 − 1 2 1 2 0 0 1 − 4 5 2 5 − 1 5 ) = ( I ∣ A − 1 ) \left(\begin{array}{lll|rrr}
1 & 0 & 0 & \frac{7}{10} & -\frac{1}{10} & \frac{3}{10} \\
0 & 1 & 0 & \frac{1}{2} & -\frac{1}{2} & \frac{1}{2} \\
0 & 0 & 1 & -\frac{4}{5} & \frac{2}{5} & -\frac{1}{5}
\end{array}\right)=\left(\mathbf{I} \mid \mathbf{A}^{-1}\right)
1 0 0 0 1 0 0 0 1 10 7 2 1 − 5 4 − 10 1 − 2 1 5 2 10 3 2 1 − 5 1 = ( I ∣ A − 1 )
因此
A − 1 = ( 7 10 − 1 10 3 10 1 2 − 1 2 1 2 − 4 5 2 5 − 1 5 ) \mathbf{A}^{-1}=\left(\begin{array}{rrr}
\frac{7}{10} & -\frac{1}{10} & \frac{3}{10} \\
\frac{1}{2} & -\frac{1}{2} & \frac{1}{2} \\
-\frac{4}{5} & \frac{2}{5} & -\frac{1}{5}
\end{array}\right)
A − 1 = 10 7 2 1 − 5 4 − 10 1 − 2 1 5 2 10 3 2 1 − 5 1
事实上,这个矩阵是 A 的逆矩阵,这一点可以通过与原始矩阵 A \mathbf{A} A 进行直接乘法来验证。
忠实保持原有格式的中文翻译如下:
这个例子之所以稍微简单一些,是因为给定的矩阵 A \mathbf{A} A 在左上角有一个 1 ( a 11 = 1 ) \left(a_{11}=1\right) ( a 11 = 1 ) 。如果情况并非如此,那么第一步是通过将第一行乘以 1 / a 11 1 / a_{11} 1/ a 11 来在该位置产生一个 1,前提是 a 11 ≠ 0 a_{11} \neq 0 a 11 = 0 。如果 a 11 = 0 a_{11}=0 a 11 = 0 ,那么必须将第一行与某些其他行互换,以便在继续之前将非零元置于左上角位置。如果因为第一列中的每个元素都是零而无法做到这一点,则该矩阵没有逆,并且是奇异的。在过程的后续阶段也可能出现类似情况,解决方法是相同的:将给定行与下方某行互换,以便将非零元移至所需的对角线位置。如果在任何阶段无法做到这一点,则原始矩阵是奇异的。
矩阵函数。我们有时需要考虑其元素是实变量 t t t 的函数的向量或矩阵。我们分别记作
x ( t ) = ( x 1 ( t ) ⋮ x n ( t ) ) 和 A ( t ) = ( a 11 ( t ) ⋯ a 1 n ( t ) ⋮ ⋮ a m 1 ( t ) ⋯ a m n ( t ) ) (25) \mathbf{x}(t)=\left(\begin{array}{c}
x_{1}(t) \tag{25}\\
\vdots \\
x_{n}(t)
\end{array}\right) \text { 和 } \mathbf{A}(t)=\left(\begin{array}{ccc}
a_{11}(t) & \cdots & a_{1 n}(t) \\
\vdots & & \vdots \\
a_{m 1}(t) & \cdots & a_{m n}(t)
\end{array}\right)
x ( t ) = x 1 ( t ) ⋮ x n ( t ) 和 A ( t ) = a 11 ( t ) ⋮ a m 1 ( t ) ⋯ ⋯ a 1 n ( t ) ⋮ a mn ( t ) ( 25 )
矩阵 A ( t ) \mathbf{A}(t) A ( t ) 被称为在 t = t 0 t=t_{0} t = t 0 或在区间 α < t < β \alpha<t<\beta α < t < β 上连续,如果 A \mathbf{A} A 的每个元素在给定点或给定区间上是连续函数。类似地,如果矩阵 A ( t ) \mathbf{A}(t) A ( t ) 的每个元素都是可导的,则称其可导,其导数 d A / d t d \mathbf{A} / d t d A / d t 定义为
d A d t = ( d a i j d t ) \begin{equation*}
\frac{d \mathbf{A}}{d t}=\left(\frac{d a_{i j}}{d t}\right) \tag{26}
\end{equation*}
d t d A = ( d t d a ij ) ( 26 )
也就是说,d A / d t d \mathbf{A} / d t d A / d t 的每个元素是 A \mathbf{A} A 对应元素的导数。同理,矩阵函数的积分定义为
∫ a b A ( t ) d t = ( ∫ a b a i j ( t ) d t ) \begin{equation*}
\int_{a}^{b} \mathbf{A}(t) d t=\left(\int_{a}^{b} a_{i j}(t) d t\right) \tag{27}
\end{equation*}
∫ a b A ( t ) d t = ( ∫ a b a ij ( t ) d t ) ( 27 )
例如,如果
A ( t ) = ( sin t t 1 cos t ) \mathbf{A}(t)=\left(\begin{array}{cc}
\sin t & t \\
1 & \cos t
\end{array}\right)
A ( t ) = ( sin t 1 t cos t )
则
A ′ ( t ) = ( cos t 1 0 − sin t ) 且 ∫ 0 π A ( t ) d t = ( 2 π 2 / 2 π 0 ) \mathbf{A}^{\prime}(t)=\left(\begin{array}{cc}
\cos t & 1 \\
0 & -\sin t
\end{array}\right) \text { 且 } \int_{0}^{\pi} \mathbf{A}(t) d t=\left(\begin{array}{cc}
2 & \pi^{2} / 2 \\
\pi & 0
\end{array}\right)
A ′ ( t ) = ( cos t 0 1 − sin t ) 且 ∫ 0 π A ( t ) d t = ( 2 π π 2 /2 0 )
许多基本微积分的规则很容易推广到矩阵函数;特别是,
d d t ( C A ) = C d A d t , 其中 C 是常数矩阵; d d t ( A + B ) = d A d t + d B d t d d t ( A B ) = A d B d t + d A d t B \begin{align*}
\frac{d}{d t}(\mathbf{C A}) & =\mathbf{C} \frac{d \mathbf{A}}{d t}, \quad \text { 其中 } \mathbf{C} \text { 是常数矩阵;} \tag{28}\\
\frac{d}{d t}(\mathbf{A}+\mathbf{B}) & =\frac{d \mathbf{A}}{d t}+\frac{d \mathbf{B}}{d t} \tag{29}\\
\frac{d}{d t}(\mathbf{A B}) & =\mathbf{A} \frac{d \mathbf{B}}{d t}+\frac{d \mathbf{A}}{d t} \mathbf{B} \tag{30}
\end{align*}
d t d ( CA ) d t d ( A + B ) d t d ( AB ) = C d t d A , 其中 C 是常数矩阵; = d t d A + d t d B = A d t d B + d t d A B ( 28 ) ( 29 ) ( 30 )
在方程 (28) 和 (30) 中,必须小心处理每一项,避免交换乘法的顺序。方程 (26) 和 (27) 所表达的定义也作为特例适用于向量。
在本节结束时,我们提供一个重要的提醒:对矩阵进行的某些运算是通过分别对矩阵的每个元素应用该运算来完成的。例子包括乘以一个数、求导和积分。然而,许多其他运算并非如此。例如,矩阵的平方不是通过将其每个元素平方来计算的。
7.3 线性代数方程组;线性无关性,特征值,特征向量
在本节中,我们回顾线性代数中的一些结果,这些结果对于线性微分方程组的求解尤其重要。其中有些结果很容易证明,有些则不然;由于我们只是想简洁地总结一些有用的信息,在这两种情况下我们都不给出证明。本节中的所有结果都依赖于关于线性代数方程组解的一些基本事实。
线性代数方程组。一组含有 n n n 个变量的 n n n 个联立线性代数方程
a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 , ⋮ a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n \begin{align*}
& a_{11} x_{1}+a_{12} x_{2}+\cdots+a_{1 n} x_{n}=b_{1}, \\
& \vdots \tag{1}\\
& a_{n 1} x_{1}+a_{n 2} x_{2}+\cdots+a_{n n} x_{n}=b_{n}
\end{align*}
a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 , ⋮ a n 1 x 1 + a n 2 x 2 + ⋯ + a nn x n = b n ( 1 )
可以写成矩阵形式如下
A x = b \begin{equation*}
\mathbf{A x}=\mathbf{b} \tag{2}
\end{equation*}
Ax = b ( 2 )
其中给定了 n × n n \times n n × n 矩阵 A \mathbf{A} A 和 n n n 维向量 b \mathbf{b} b ,而要确定的是 n n n 维向量 x \mathbf{x} x 的分量。如果 b = 0 \mathbf{b}=\mathbf{0} b = 0 ,则称该方程组是齐次的;否则,它是非齐次的。
如果系数矩阵 A \mathbf{A} A 是非奇异的——也就是说,如果 det A \operatorname{det} \mathbf{A} det A 不为零——则对于任何向量 b \mathbf{b} b ,方程组 (2) 都有唯一的解。由于 A \mathbf{A} A 是非奇异的,A − 1 \mathbf{A}^{-1} A − 1 存在,并且可以通过将方程 (2) 的两边左乘 A − 1 \mathbf{A}^{-1} A − 1 来找到解;因此
x = A − 1 b \begin{equation*}
\mathbf{x}=\mathbf{A}^{-1} \mathbf{b} \tag{3}
\end{equation*}
x = A − 1 b ( 3 )
特别地,对应于方程 (2) 中的 b = 0 \mathbf{b}=\mathbf{0} b = 0 的齐次问题 A x = 0 \mathbf{A x}=\mathbf{0} Ax = 0 只有平凡解 x = 0 \mathbf{x}=\mathbf{0} x = 0 。
另一方面,如果 A \mathbf{A} A 是奇异的——也就是说,如果 det A \operatorname{det} \mathbf{A} det A 为零——则取决于具体的右侧项 b \mathbf{b} b ,方程 (2) 的解可能不存在,或者存在但不唯一。由于 A \mathbf{A} A 是奇异的,A − 1 \mathbf{A}^{-1} A − 1 不存在,所以方程 (3) 不再有效。
当 A \mathbf{A} A 是奇异的,齐次方程组
A x = 0 \begin{equation*}
\mathbf{A x}=\mathbf{0} \tag{4}
\end{equation*}
Ax = 0 ( 4 )
除平凡解外,有(无穷多)非零解。非齐次方程组 (2) 的情况更复杂。这个方程组没有解,除非向量 b \mathbf{b} b 满足某个进一步的条件。这个条件是
( b , y ) = 0 \begin{equation*}
(\mathbf{b}, \mathbf{y})=0 \tag{5}
\end{equation*}
( b , y ) = 0 ( 5 )
chinese
对于满足 A ∗ y = 0 \mathbf{A}^{*} \mathbf{y}=\mathbf{0} A ∗ y = 0 的所有向量 y \mathbf{y} y ,其中 A ∗ \mathbf{A}^{*} A ∗ 是 A \mathbf{A} A 的伴随矩阵。如果条件 (5) 满足,则系统 (2) 有 (无穷多) 解。这些解的形式为
x = x ( 0 ) + ξ \begin{equation*}
\mathbf{x}=\mathbf{x}^{(0)}+\boldsymbol{\xi} \tag{6}
\end{equation*}
x = x ( 0 ) + ξ ( 6 )
其中x ( 0 ) \mathbf{x}^{(0)} x ( 0 ) 是方程 (2) 的一个特解,而 ξ \boldsymbol{\xi} ξ 是齐次系统 (4) 的最一般解。注意方程 (6) 与非齐次线性微分方程的解之间的相似之处。前面一些陈述的证明在问题 21 至 25 中有概述。
前一段中的结果作为对线性系统解进行分类的一种方法非常重要。然而,对于求解特定的系统,通常最好使用行约简将系统转换为一个简单得多的系统,从中可以轻松地写下解(如果存在的话)。为了有效地做到这一点,我们可以构造增广矩阵
( A ∣ b ) = ( a 11 ⋯ a 1 n b 1 ⋮ ⋮ ⋮ a n 1 ⋯ a n n b n ) (7) (\mathbf{A} \mid \mathbf{b})=\left(\begin{array}{ccc|c}
a_{11} & \cdots & a_{1 n} & b_{1} \tag{7}\\
\vdots & & \vdots & \vdots \\
a_{n 1} & \cdots & a_{n n} & b_{n}
\end{array}\right)
( A ∣ b ) = a 11 ⋮ a n 1 ⋯ ⋯ a 1 n ⋮ a nn b 1 ⋮ b n ( 7 )
通过将向量b \mathbf{b} b 作为附加列并入系数矩阵 A \mathbf{A} A 。垂直线替代了等号,并据说分隔了增广矩阵。我们现在对增广矩阵执行行运算,以便将 A \mathbf{A} A 转换为一个上三角矩阵——即,主对角线以下的所有元素均为零的矩阵。一旦完成此操作,就很容易看出系统是否有解,并在有解时找到它们。注意,对增广矩阵 (7) 执行的初等行运算对应于对系统 (1) 中方程执行的合法运算。以下示例说明了该过程。
示例 1
求解方程组
x 1 − 2 x 2 + 3 x 3 = 7 − x 1 + x 2 − 2 x 3 = − 5 2 x 1 − x 2 − x 3 = 4 \begin{align*}
x_{1}-2 x_{2}+3 x_{3}= & 7 \\
-x_{1}+x_{2}-2 x_{3}= & -5 \tag{8}\\
2 x_{1}-x_{2}-x_{3}= & 4
\end{align*}
x 1 − 2 x 2 + 3 x 3 = − x 1 + x 2 − 2 x 3 = 2 x 1 − x 2 − x 3 = 7 − 5 4 ( 8 )
解:
系统 (8) 的增广矩阵为
( 1 − 2 3 7 − 1 1 − 2 − 5 2 − 1 − 1 4 ) (9) \left(\begin{array}{rrr|r}
1 & -2 & 3 & 7 \tag{9}\\
-1 & 1 & -2 & -5 \\
2 & -1 & -1 & 4
\end{array}\right)
1 − 1 2 − 2 1 − 1 3 − 2 − 1 7 − 5 4 ( 9 )
我们现在对矩阵 (9) 执行行运算,以便在矩阵的左下部分引入零。下面描述并记录了每个步骤的结果。
(a) 将第一行加到第二行,并将第一行乘以 (-2) 加到第三行。
( 1 − 2 3 7 0 − 1 1 2 0 3 − 7 − 10 ) \left(\begin{array}{rrr|r}
1 & -2 & 3 & 7 \\
0 & -1 & 1 & 2 \\
0 & 3 & -7 & -10
\end{array}\right)
1 0 0 − 2 − 1 3 3 1 − 7 7 2 − 10
(b) 将第二行乘以 -1 。
( 1 − 2 3 7 0 1 − 1 − 2 0 3 − 7 − 10 ) \left(\begin{array}{rrr|r}
1 & -2 & 3 & 7 \\
0 & 1 & -1 & -2 \\
0 & 3 & -7 & -10
\end{array}\right)
1 0 0 − 2 1 3 3 − 1 − 7 7 − 2 − 10
(c) 将第二行乘以 (-3) 加到第三行。
( 1 − 2 3 7 0 1 − 1 − 2 0 0 − 4 − 4 ) \left(\begin{array}{rrr|r}
1 & -2 & 3 & 7 \\
0 & 1 & -1 & -2 \\
0 & 0 & -4 & -4
\end{array}\right)
1 0 0 − 2 1 0 3 − 1 − 4 7 − 2 − 4
(d) 将第三行除以 -4 。
( 1 − 2 3 7 0 1 − 1 − 2 0 0 1 1 ) \left(\begin{array}{rrr|r}
1 & -2 & 3 & 7 \\
0 & 1 & -1 & -2 \\
0 & 0 & 1 & 1
\end{array}\right)
1 0 0 − 2 1 0 3 − 1 1 7 − 2 1
以这种方式获得的矩阵对应于方程组
x 1 − 2 x 2 + 3 x 3 = 7 , x 2 − x 3 = − 2 , x 3 = 1 , \begin{align*}
x_{1}-2 x_{2}+3 x_{3} & =7, \\
x_{2}-x_{3} & =-2, \tag{10}\\
x_{3} & =1,
\end{align*}
x 1 − 2 x 2 + 3 x 3 x 2 − x 3 x 3 = 7 , = − 2 , = 1 , ( 10 )
它等价于原始系统 (8)。注意,方程 (10) 中的系数构成一个三角矩阵。从方程 (10) 的最后一个方程,我们得出x 3 = 1 x_{3}=1 x 3 = 1 ;从第二个方程,x 2 = − 2 + x 3 = − 1 x_{2}=-2+x_{3}=-1 x 2 = − 2 + x 3 = − 1 ;从第一个方程,x 1 = 7 + 2 x 2 − 3 x 3 = 2 x_{1}=7+2 x_{2}-3 x_{3}=2 x 1 = 7 + 2 x 2 − 3 x 3 = 2 。因此我们得到
x = ( 2 − 1 1 ) \mathbf{x}=\left(\begin{array}{r}
2 \\
-1 \\
1
\end{array}\right)
x = 2 − 1 1
这是给定系统 (8) 的解。顺便提一下,由于解是唯一的,我们得出结论系数矩阵是非奇异的。
示例 2
讨论系统解
x 1 − 2 x 2 + 3 x 3 = b 1 , − x 1 + x 2 − 2 x 3 = b 2 , 2 x 1 − x 2 + 3 x 3 = b 3 \begin{align*}
x_{1}-2 x_{2}+3 x_{3} & =b_{1}, \\
-x_{1}+x_{2}-2 x_{3} & =b_{2}, \tag{11}\\
2 x_{1}-x_{2}+3 x_{3} & =b_{3}
\end{align*}
x 1 − 2 x 2 + 3 x 3 − x 1 + x 2 − 2 x 3 2 x 1 − x 2 + 3 x 3 = b 1 , = b 2 , = b 3 ( 11 )
对于b 1 , b 2 b_{1}, b_{2} b 1 , b 2 和 b 3 b_{3} b 3 的不同值而言。
解:
观察到,系统 (11) 中的系数与系统 (8) 中的系数相同,除了第三个方程中 x 3 x_{3} x 3 的系数。系统 (11) 的增广矩阵为
( 1 − 2 3 b 1 − 1 1 − 2 b 2 2 − 1 3 b 3 ) . (12) \left(\begin{array}{rrr|r}
1 & -2 & 3 & b_{1} \tag{12}\\
-1 & 1 & -2 & b_{2} \\
2 & -1 & 3 & b_{3}
\end{array}\right) .
1 − 1 2 − 2 1 − 1 3 − 2 3 b 1 b 2 b 3 . ( 12 )
通过执行如例 1 中的步骤 (a)、(b) 和 (c),我们将增广矩阵 (12) 变换为
( 1 − 2 3 b 1 0 1 − 1 − b 1 − b 2 0 0 0 b 1 + 3 b 2 + b 3 ) (13) \left(\begin{array}{rrr|l}
1 & -2 & 3 & b_{1} \tag{13}\\
0 & 1 & -1 & -b_{1}-b_{2} \\
0 & 0 & 0 & b_{1}+3 b_{2}+b_{3}
\end{array}\right)
1 0 0 − 2 1 0 3 − 1 0 b 1 − b 1 − b 2 b 1 + 3 b 2 + b 3 ( 13 )
对应于矩阵 (13) 的第三行的方程为
b 1 + 3 b 2 + b 3 = 0 ; \begin{equation*}
b_{1}+3 b_{2}+b_{3}=0 ; \tag{14}
\end{equation*}
b 1 + 3 b 2 + b 3 = 0 ; ( 14 )
因此,除非条件 (14) 被 b 1 , b 2 b_{1}, b_{2} b 1 , b 2 和 b 3 b_{3} b 3 满足,否则系统 (11) 无解。可以证明,此条件正是系统 (11) 的方程 (5)。
现在假设 b 1 = 2 , b 2 = 1 b_{1}=2, b_{2}=1 b 1 = 2 , b 2 = 1 和 b 3 = − 5 b_{3}=-5 b 3 = − 5 ,此时方程 (14) 被满足。则矩阵 (13) 的前两行对应于方程
x 1 − 2 x 2 + 3 x 3 = 2 , x 2 − x 3 = − 3. \begin{align*}
x_{1}-2 x_{2}+3 x_{3} & =2, \\
x_{2}-x_{3} & =-3 . \tag{15}
\end{align*}
x 1 − 2 x 2 + 3 x 3 x 2 − x 3 = 2 , = − 3. ( 15 )
为了求解系统 (15),我们可以任意选择其中一个未知数,然后求解另外两个。如果令 x 3 = α x_{3}=\alpha x 3 = α ,其中 α \alpha α 是任意的,则可推导出
x 2 = x 3 − 3 = α − 3 x 1 = 2 x 2 − 3 x 3 + 2 = 2 ( α − 3 ) − 3 α + 2 = − α − 4 \begin{aligned}
& x_{2}=x_{3}-3=\alpha-3 \\
& x_{1}=2 x_{2}-3 x_{3}+2=2(\alpha-3)-3 \alpha+2=-\alpha-4
\end{aligned}
x 2 = x 3 − 3 = α − 3 x 1 = 2 x 2 − 3 x 3 + 2 = 2 ( α − 3 ) − 3 α + 2 = − α − 4
如果我们用向量记法写出解,则有
x = ( − α − 4 α − 3 α ) = α ( − 1 1 1 ) + ( − 4 − 3 0 ) . (16) \mathbf{x}=\left(\begin{array}{c}
-\alpha-4 \tag{16}\\
\alpha-3 \\
\alpha
\end{array}\right)=\alpha\left(\begin{array}{r}
-1 \\
1 \\
1
\end{array}\right)+\left(\begin{array}{r}
-4 \\
-3 \\
0
\end{array}\right) .
x = − α − 4 α − 3 α = α − 1 1 1 + − 4 − 3 0 . ( 16 )
容易验证,方程 (16) 右侧的第二项是非齐次系统 (11) 的一个解,而第一项是对应于 (11) 的齐次系统的最一般解。
行简化也常用于求解齐次系统以及方程个数与未知数个数不同的系统。
线性相关与线性无关。若存在一组实数或复数 c 1 , … , c k c_{1}, \ldots, c_{k} c 1 , … , c k ,其中至少有一个非零,使得 k k k 个向量 x ( 1 ) , … , x ( k ) \mathbf{x}^{(1)}, \ldots, \mathbf{x}^{(k)} x ( 1 ) , … , x ( k ) 满足下式,则称这组向量是线性相关的:
c 1 x ( 1 ) + ⋯ + c k x ( k ) = 0. \begin{equation*}
c_{1} \mathbf{x}^{(1)}+\cdots+c_{k} \mathbf{x}^{(k)}=\mathbf{0} . \tag{17}
\end{equation*}
c 1 x ( 1 ) + ⋯ + c k x ( k ) = 0 . ( 17 )
换句话说,如果向量 x ( 1 ) , … , x ( k ) \mathbf{x}^{(1)}, \ldots, \mathbf{x}^{(k)} x ( 1 ) , … , x ( k ) 之间存在线性关系,则它们是线性相关的。另一方面,如果使得方程 (17) 成立的系数 c 1 , … , c k c_{1}, \ldots, c_{k} c 1 , … , c k 的唯一取值是 c 1 = c 2 = ⋯ = c k = 0 c_{1}=c_{2}=\cdots=c_{k}=0 c 1 = c 2 = ⋯ = c k = 0 ,则称向量 x ( 1 ) , … , x ( k ) \mathbf{x}^{(1)}, \ldots, \mathbf{x}^{(k)} x ( 1 ) , … , x ( k ) 是线性无关的。
现在考虑由 n n n 个向量组成的集合,其中每个向量都有 n n n 个分量。通过将向量 x ( j ) \mathbf{x}^{(j)} x ( j ) 放入矩阵 X \mathbf{X} X 的第 j j j 列来构成 n × n n \times n n × n 矩阵 X \mathbf{X} X 。因此 X = ( x i j ) \mathbf{X}=\left(x_{i j}\right) X = ( x ij ) ,其中 x i j = x i ( j ) x_{i j}=x_{i}^{(j)} x ij = x i ( j ) ,即向量 x ( j ) \mathbf{x}^{(j)} x ( j ) 的第 i i i 个分量。另设 c = ( c j ) \mathbf{c}=\left(c_{j}\right) c = ( c j ) 。则方程 (17) 可以写成
( x 1 ( 1 ) c 1 + ⋯ + x 1 ( n ) c n ⋮ ⋮ x n ( 1 ) c 1 + ⋯ + x n ( n ) c n ) = ( x 11 c 1 + ⋯ + x 1 n c n ⋮ ⋮ x n 1 c 1 + ⋯ + x n n c n ) = 0 \left(\begin{array}{ccc}
x_{1}^{(1)} c_{1} & +\cdots+ & x_{1}^{(n)} c_{n} \\
\vdots & & \vdots \\
x_{n}^{(1)} c_{1} & +\cdots+ & x_{n}^{(n)} c_{n}
\end{array}\right)=\left(\begin{array}{ccc}
x_{11} c_{1} & +\cdots+ & x_{1 n} c_{n} \\
\vdots & & \vdots \\
x_{n 1} c_{1} & +\cdots+ & x_{n n} c_{n}
\end{array}\right)=\mathbf{0}
x 1 ( 1 ) c 1 ⋮ x n ( 1 ) c 1 + ⋯ + + ⋯ + x 1 ( n ) c n ⋮ x n ( n ) c n = x 11 c 1 ⋮ x n 1 c 1 + ⋯ + + ⋯ + x 1 n c n ⋮ x nn c n = 0
或者,等价地,
X c = 0 \begin{equation*}
\mathbf{X c}=\mathbf{0} \tag{18}
\end{equation*}
Xc = 0 ( 18 )
好的,以下是忠实于原文格式的中文翻译:
如果 det X ≠ 0 \operatorname{det} \mathbf{X} \neq 0 det X = 0 ,则方程 (18) 的唯一解是 c = 0 \mathbf{c}=\mathbf{0} c = 0 ,但如果 det X = 0 \operatorname{det} \mathbf{X}=0 det X = 0 ,则存在非零解。因此,向量组 x ( 1 ) , … , x ( n ) \mathbf{x}^{(1)}, \ldots, \mathbf{x}^{(n)} x ( 1 ) , … , x ( n ) 是线性无关的当且仅当 det X ≠ 0 \operatorname{det} \mathbf{X} \neq 0 det X = 0 。
例如,向量 ( 1 − 1 2 ) 、 ( − 2 1 − 1 ) \left(\begin{array}{r}1 \\ -1 \\ 2\end{array}\right)、\left(\begin{array}{r}-2 \\ 1 \\ -1\end{array}\right) 1 − 1 2 、 − 2 1 − 1 和 ( 3 − 2 − 1 ) \left(\begin{array}{r}3 \\ -2 \\ -1\end{array}\right) 3 − 2 − 1 是线性无关的;参见例 1。类似地,从例 2 我们知道向量 ( 1 − 1 2 ) 、 ( − 2 1 − 1 ) \left(\begin{array}{r}1 \\ -1 \\ 2\end{array}\right)、\left(\begin{array}{r}-2 \\ 1 \\ -1\end{array}\right) 1 − 1 2 、 − 2 1 − 1 和 ( 3 − 2 3 ) \left(\begin{array}{r}3 \\ -2 \\ 3\end{array}\right) 3 − 2 3 是线性相关的。
例 3
确定向量
x ( 1 ) = ( 1 2 − 1 ) , x ( 2 ) = ( 2 1 3 ) , x ( 3 ) = ( − 4 1 − 11 ) (19) \mathbf{x}^{(1)}=\left(\begin{array}{r}
1 \tag{19}\\
2 \\
-1
\end{array}\right), \quad \mathbf{x}^{(2)}=\left(\begin{array}{l}
2 \\
1 \\
3
\end{array}\right), \quad \mathbf{x}^{(3)}=\left(\begin{array}{r}
-4 \\
1 \\
-11
\end{array}\right)
x ( 1 ) = 1 2 − 1 , x ( 2 ) = 2 1 3 , x ( 3 ) = − 4 1 − 11 ( 19 )
是线性无关还是线性相关的。如果它们是线性相关的,找到它们之间的一个线性关系。
解:
要确定 x ( 1 ) 、 x ( 2 ) \mathbf{x}^{(1)}、\mathbf{x}^{(2)} x ( 1 ) 、 x ( 2 ) 和 x ( 3 ) \mathbf{x}^{(3)} x ( 3 ) 是否线性相关,我们寻找常数 c 1 、 c 2 c_{1}、c_{2} c 1 、 c 2 和 c 3 c_{3} c 3 ,使得
c 1 x ( 1 ) + c 2 x ( 2 ) + c 3 x ( 3 ) = 0. \begin{equation*}
c_{1} \mathbf{x}^{(1)}+c_{2} \mathbf{x}^{(2)}+c_{3} \mathbf{x}^{(3)}=\mathbf{0} . \tag{20}
\end{equation*}
c 1 x ( 1 ) + c 2 x ( 2 ) + c 3 x ( 3 ) = 0 . ( 20 )
方程 (20) 也可以写成以下形式
( 1 2 − 4 2 1 1 − 1 3 − 11 ) ( c 1 c 2 c 3 ) = ( 0 0 0 ) (21) \left(\begin{array}{rrr}
1 & 2 & -4 \tag{21}\\
2 & 1 & 1 \\
-1 & 3 & -11
\end{array}\right)\left(\begin{array}{l}
c_{1} \\
c_{2} \\
c_{3}
\end{array}\right)=\left(\begin{array}{l}
0 \\
0 \\
0
\end{array}\right)
1 2 − 1 2 1 3 − 4 1 − 11 c 1 c 2 c 3 = 0 0 0 ( 21 )
并可以通过从增广矩阵开始进行初等行变换来求解
( 1 2 − 4 0 2 1 1 0 − 1 3 − 11 0 ) . (22) \left(\begin{array}{rrr|r}
1 & 2 & -4 & 0 \tag{22}\\
2 & 1 & 1 & 0 \\
-1 & 3 & -11 & 0
\end{array}\right) .
1 2 − 1 2 1 3 − 4 1 − 11 0 0 0 . ( 22 )
我们按照例 1 和例 2 的方法进行。
(a) 将第一行的 (-2) 倍加到第二行,并将第一行加到第三行。
( 1 2 − 4 0 0 − 3 9 0 0 5 − 15 0 ) \left(\begin{array}{rrr|r}
1 & 2 & -4 & 0 \\
0 & -3 & 9 & 0 \\
0 & 5 & -15 & 0
\end{array}\right)
1 0 0 2 − 3 5 − 4 9 − 15 0 0 0
(b) 将第二行除以 -3;然后将第二行的 (-5) 倍加到第三行。
( 1 2 − 4 0 0 1 − 3 0 0 0 0 0 ) \left(\begin{array}{rrr|r}
1 & 2 & -4 & 0 \\
0 & 1 & -3 & 0 \\
0 & 0 & 0 & 0
\end{array}\right)
1 0 0 2 1 0 − 4 − 3 0 0 0 0
因此,我们得到等价的方程组
c 1 + 2 c 2 − 4 c 3 = 0 , c 2 − 3 c 3 = 0. \begin{align*}
c_{1}+2 c_{2}-4 c_{3} & =0, \\
c_{2}-3 c_{3} & =0 . \tag{23}
\end{align*}
c 1 + 2 c 2 − 4 c 3 c 2 − 3 c 3 = 0 , = 0. ( 23 )
此时,我们知道方程 (20) 存在非平凡解,因此 x ( 1 ) 、 x ( 2 ) \mathbf{x}^{(1)}、\mathbf{x}^{(2)} x ( 1 ) 、 x ( 2 ) 和 x ( 3 ) \mathbf{x}^{(3)} x ( 3 ) 是线性相关的。
为了找到 x ( 1 ) 、 x ( 2 ) \mathbf{x}^{(1)}、\mathbf{x}^{(2)} x ( 1 ) 、 x ( 2 ) 和 x ( 3 ) \mathbf{x}^{(3)} x ( 3 ) 之间的一个线性关系,注意方程组 (23) 的第二个方程可以重写为 c 2 = 3 c 3 c_{2}=3 c_{3} c 2 = 3 c 3 ,然后从第一个方程我们得到 c 1 = 4 c 3 − 2 c 2 = − 2 c 3 c_{1}=4 c_{3}-2 c_{2}=-2 c_{3} c 1 = 4 c 3 − 2 c 2 = − 2 c 3 。因此,我们用 c 3 c_{3} c 3 表示出了 c 1 c_{1} c 1 和 c 2 c_{2} c 2 ,而 c 3 c_{3} c 3 保持任意。为方便起见,如果我们选择 c 3 = − 1 c_{3}=-1 c 3 = − 1 ,则 c 1 = 2 c_{1}=2 c 1 = 2 且 c 2 = − 3 c_{2}=-3 c 2 = − 3 。在这种情况下,线性关系 (20) 变为
2 x ( 1 ) − 3 x ( 2 ) − x ( 3 ) = 0 2 \mathbf{x}^{(1)}-3 \mathbf{x}^{(2)}-\mathbf{x}^{(3)}=\mathbf{0}
2 x ( 1 ) − 3 x ( 2 ) − x ( 3 ) = 0
并且给定的向量是线性相关的。
或者,如果方程 (21) 中的 3 × 3 3 \times 3 3 × 3 系数矩阵记为 X \mathbf{X} X ,我们可以计算 det X \operatorname{det} \mathbf{X} det X 。因此
det X = ∣ 1 2 − 4 2 1 1 − 1 3 − 11 ∣ = ( 1 ) ∣ 1 1 3 − 11 ∣ − ( 2 ) ∣ 2 1 − 1 − 11 ∣ + ( − 4 ) ∣ 2 1 − 1 3 ∣ = − 14 − 2 ( − 21 ) − 4 ( 7 ) = 0. \begin{aligned}
\operatorname{det} \mathbf{X} & =\left|\begin{array}{rrr}
1 & 2 & -4 \\
2 & 1 & 1 \\
-1 & 3 & -11
\end{array}\right|=(1)\left|\begin{array}{rr}
1 & 1 \\
3 & -11
\end{array}\right|-(2)\left|\begin{array}{rr}
2 & 1 \\
-1 & -11
\end{array}\right|+(-4)\left|\begin{array}{rr}
2 & 1 \\
-1 & 3
\end{array}\right| \\
& =-14-2(-21)-4(7)=0 .
\end{aligned}
det X = 1 2 − 1 2 1 3 − 4 1 − 11 = ( 1 ) 1 3 1 − 11 − ( 2 ) 2 − 1 1 − 11 + ( − 4 ) 2 − 1 1 3 = − 14 − 2 ( − 21 ) − 4 ( 7 ) = 0.
因此,x ( 1 ) , x ( 2 ) \mathbf{x}^{(1)}, \mathbf{x}^{(2)} x ( 1 ) , x ( 2 ) 和 x ( 3 ) \mathbf{x}^{(3)} x ( 3 ) 是线性相关的。然而,如果需要确定这三个向量之间线性关系的系数 c 1 , c 2 , c 3 c_{1}, c_{2}, c_{3} c 1 , c 2 , c 3 ,我们仍然需要求解方程(20)来找到它们。
在很多情况下,将矩阵 A \mathbf{A} A 的列(或行)看作向量是非常有用的。如果这些列(或行)向量线性无关,则当且仅当 det A ≠ 0 \operatorname{det} \mathbf{A} \neq 0 det A = 0 。此外,如果 C = A B \mathbf{C}=\mathbf{A B} C = AB ,则可以证明 det C = ( det A ) ( det B ) \operatorname{det} \mathbf{C}=(\operatorname{det} \mathbf{A})(\operatorname{det} \mathbf{B}) det C = ( det A ) ( det B ) 。因此,如果 A \mathbf{A} A 和 B \mathbf{B} B 的列(或行)都是线性无关的,那么 C \mathbf{C} C 的列(或行)也必然是线性无关的。
现在我们将线性相关性和线性无关性的概念扩展到一组定义在区间 α < t < β \alpha<t<\beta α < t < β 上的向量函数 x ( 1 ) ( t ) , … , x ( k ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(k)}(t) x ( 1 ) ( t ) , … , x ( k ) ( t ) 。如果存在一组不全为零的常数 c _ 1 , … , c _ k c\_{1}, \ldots, c\_{k} c _ 1 , … , c _ k ,使得
c 1 x ( 1 ) ( t ) + ⋯ + c k x ( k ) ( t ) = 0 对区间内所有 t 成立, c_{1} \mathbf{x}^{(1)}(t)+\cdots+c_{k} \mathbf{x}^{(k)}(t)=\mathbf{0} \quad \text{对区间内所有 } t \text{ 成立,}
c 1 x ( 1 ) ( t ) + ⋯ + c k x ( k ) ( t ) = 0 对区间内所有 t 成立,
则称这些向量 x ( 1 ) ( t ) , … , x ( k ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(k)}(t) x ( 1 ) ( t ) , … , x ( k ) ( t ) 在区间 α < t < β \alpha<t<\beta α < t < β 上线性相关。
否则,就称它们在线性上是无关的。请注意,如果 x ( 1 ) ( t ) , … , x ( k ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(k)}(t) x ( 1 ) ( t ) , … , x ( k ) ( t ) 在某区间上线性相关,那么它们在该区间内的每一点都是线性相关的;但如果它们在某区间上线性无关,它们在每个点上可能线性无关,也可能在每个点上是线性相关的,不过在不同点上相关的系数组可能不同。见习题13中的例子。
特征值与特征向量。
方程:
A x = y \begin{equation*}
\mathbf{A x}=\mathbf{y} \tag{24}
\end{equation*}
Ax = y ( 24 )
可以被看作是一个线性变换,它将给定的向量 x \mathbf{x} x 映射(或变换)为一个新的向量 y \mathbf{y} y 。在许多应用中,将自身映射为其倍数的向量具有重要意义,例如在求解具有常系数的一阶线性微分方程组中。
为了寻找这样的向量,我们令 y = λ x \mathbf{y}=\lambda \mathbf{x} y = λ x ,其中 λ \lambda λ 是一个标量比例因子,并寻找满足下列方程的解:
A x = λ x \begin{equation*}
\mathbf{A} \mathbf{x}=\lambda \mathbf{x} \tag{25}
\end{equation*}
Ax = λ x ( 25 )
或
( A − λ I ) x = 0 \begin{equation*}
(\mathbf{A}-\lambda \mathbf{I}) \mathbf{x}=\mathbf{0} \tag{26}
\end{equation*}
( A − λ I ) x = 0 ( 26 )
上述方程在且仅在 λ \lambda λ 满足下式时,才有非零解:
det ( A − λ I ) = 0 \begin{equation*}
\operatorname{det}(\mathbf{A}-\lambda \mathbf{I})=0 \tag{27}
\end{equation*}
det ( A − λ I ) = 0 ( 27 )
方程(27)是 λ \lambda λ 的 n n n 次多项式方程,称为矩阵 A \mathbf{A} A 的特征方程(characteristic equation) 。满足该方程的 λ \lambda λ 值可以是实数,也可以是复数,称为矩阵 A \mathbf{A} A 的特征值(eigenvalues) 。利用这些 λ \lambda λ 值所求得的方程(25)或(26)的非零解 x \mathbf{x} x ,称为对应于该特征值的特征向量(eigenvectors) 。
下面的例子将说明如何求特征值和特征向量。
例题 4
求矩阵的特征值和特征向量:
A = ( 3 − 1 4 − 2 ) (28) \mathbf{A}=\left(\begin{array}{ll}
3 & -1 \tag{28}\\
4 & -2
\end{array}\right)
A = ( 3 4 − 1 − 2 ) ( 28 )
解:
特征值 λ \lambda λ 和特征向量 x \mathbf{x} x 满足方程 ( A − λ I ) x = 0 (\mathbf{A}-\lambda \mathbf{I}) \mathbf{x}=\mathbf{0} ( A − λ I ) x = 0 ,即:
( 3 − λ − 1 4 − 2 − λ ) ( x 1 x 2 ) = ( 0 0 ) 。 (29) \left(\begin{array}{cc}
3-\lambda & -1 \tag{29}\\
4 & -2-\lambda
\end{array}\right)\binom{x_{1}}{x_{2}}=\binom{0}{0}。
( 3 − λ 4 − 1 − 2 − λ ) ( x 2 x 1 ) = ( 0 0 ) 。 ( 29 )
特征值是如下特征方程的根:
det ( A − λ I ) = ∣ 3 − λ − 1 4 − 2 − λ ∣ = λ 2 − λ − 2 = ( λ − 2 ) ( λ + 1 ) = 0. (30) \operatorname{det}(\mathbf{A}-\lambda \mathbf{I})=\left|\begin{array}{cc}
3-\lambda & -1 \tag{30}\\
4 & -2-\lambda
\end{array}\right|=\lambda^{2}-\lambda-2=(\lambda-2)(\lambda+1)=0 .
det ( A − λ I ) = 3 − λ 4 − 1 − 2 − λ = λ 2 − λ − 2 = ( λ − 2 ) ( λ + 1 ) = 0. ( 30 )
因此,特征值为 λ 1 = 2 \lambda_{1}=2 λ 1 = 2 和 λ 2 = − 1 \lambda_{2}=-1 λ 2 = − 1 。
[^4] 求具有有限自由度的保守系统中的自由振动模式。
为了找到特征向量,我们回到方程 (29) 并依次用每个特征值替换 λ \lambda λ 。对于 λ = 2 \lambda=2 λ = 2 ,我们有
( 1 − 1 4 − 4 ) ( x 1 x 2 ) = ( 0 0 ) . (31) \left(\begin{array}{ll}
1 & -1 \tag{31}\\
4 & -4
\end{array}\right)\binom{x_{1}}{x_{2}}=\binom{0}{0} .
( 1 4 − 1 − 4 ) ( x 2 x 1 ) = ( 0 0 ) . ( 31 )
因此,该向量方程的每一行都得出条件 x 1 − x 2 = 0 x_{1}-x_{2}=0 x 1 − x 2 = 0 ,所以 x 1 x_{1} x 1 和 x 2 x_{2} x 2 相等但其值未确定。如果 x 1 = c x_{1}=c x 1 = c ,则 x 2 = c x_{2}=c x 2 = c 也成立,并且特征向量 x ( 1 ) \mathbf{x}^{(1)} x ( 1 ) 为
x ( 1 ) = c ( 1 1 ) , c ≠ 0 \begin{equation*}
\mathbf{x}^{(1)}=c\binom{1}{1}, \quad c \neq 0 \tag{32}
\end{equation*}
x ( 1 ) = c ( 1 1 ) , c = 0 ( 32 )
因此,对于特征值 λ 1 = 2 \lambda_{1}=2 λ 1 = 2 ,存在由任意常数 c c c 索引的无限族特征向量。我们将选择该族中的一个成员作为其余特征向量的代表;在此示例中,似乎最简单的方法是令 c = 1 c=1 c = 1 。然后,代替方程 (32),我们写出
x ( 1 ) = ( 1 1 ) \begin{equation*}
\mathbf{x}^{(1)}=\binom{1}{1} \tag{33}
\end{equation*}
x ( 1 ) = ( 1 1 ) ( 33 )
并记住该向量的任何非零倍数也是特征向量。我们说 x ( 1 ) \mathbf{x}^{(1)} x ( 1 ) 是对应于特征值 λ 1 = 2 \lambda_{1}=2 λ 1 = 2 的特征向量。
现在,在方程 (29) 中令 λ = − 1 \lambda=-1 λ = − 1 ,我们得到
( 4 − 1 4 − 1 ) ( x 1 x 2 ) = ( 0 0 ) . (34) \left(\begin{array}{ll}
4 & -1 \tag{34}\\
4 & -1
\end{array}\right)\binom{x_{1}}{x_{2}}=\binom{0}{0} .
( 4 4 − 1 − 1 ) ( x 2 x 1 ) = ( 0 0 ) . ( 34 )
同样,我们得到关于 x 1 x_{1} x 1 和 x 2 x_{2} x 2 的一个条件,即 4 x 1 − x 2 = 0 4 x_{1}-x_{2}=0 4 x 1 − x 2 = 0 。因此,对应于特征值 λ 2 = − 1 \lambda_{2}=-1 λ 2 = − 1 的特征向量为
x ( 2 ) = ( 1 4 ) \begin{equation*}
\mathbf{x}^{(2)}=\binom{1}{4} \tag{35}
\end{equation*}
x ( 2 ) = ( 4 1 ) ( 35 )
或该向量的任何非零倍数。
如例 4 所示,特征向量仅由一个任意的非零乘数常数确定;如果以某种方式指定此常数,则称这些特征向量是归一化的。在例 4 中,我们选择常数 c c c ,使得特征向量的分量为小整数。然而,任何其他非零的 c c c 选择同样有效,尽管可能不太方便。有时,通过选择常数使得特征向量 x \mathbf{x} x 的长度 ∥ x ∥ = ( x , x ) 1 / 2 = 1 \|\mathbf{x}\|=(\mathbf{x}, \mathbf{x})^{1 / 2}=1 ∥ x ∥ = ( x , x ) 1/2 = 1 来归一化特征向量 x \mathbf{x} x 是有用的。
由于 n × n n \times n n × n 矩阵 A \mathbf{A} A 的特征方程 (27) 是关于 λ \lambda λ 的 n n n 次多项式方程,因此每个 n × n n \times n n × n 矩阵都有 n n n 个特征值 λ 1 , … , λ n \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n ,其中一些可能重复。如果一个给定的特征值作为方程 (27) 的根出现了 m m m 次,则称该特征值具有代数重数 m m m 。每个特征值至少有一个相关的特征向量,但可以有其他线性无关的特征向量。如果一个特征值有 q q q 个线性无关的特征向量,我们称该特征值具有几何重数 q q q 。可以证明
1 ≤ q ≤ m \begin{equation*}
1 \leq q \leq m \tag{36}
\end{equation*}
1 ≤ q ≤ m ( 36 )
也就是说,几何重数永远不会超过代数重数。示例表明,q q q 可以是此区间内的任何整数。如果 A \mathbf{A} A 的每个特征值都是单的(代数重数为 1),则每个特征值也具有几何重数 1。
可以证明,如果λ 1 \lambda_{1} λ 1 和 λ 2 \lambda_{2} λ 2 是矩阵 A \mathbf{A} A 的两个特征值,并且如果 λ 1 ≠ λ 2 \lambda_{1} \neq \lambda_{2} λ 1 = λ 2 ,则它们对应的特征向量 x ( 1 ) \mathbf{x}^{(1)} x ( 1 ) 和 x ( 2 ) \mathbf{x}^{(2)} x ( 2 ) 是线性独立的(问题 29)。此结果可推广到任意集合的不同特征值 λ 1 , … , λ k \lambda_{1}, \ldots, \lambda_{k} λ 1 , … , λ k :它们的特征向量 x ( 1 ) , … , x ( k ) \mathbf{x}^{(1)}, \ldots, \mathbf{x}^{(k)} x ( 1 ) , … , x ( k ) 是线性独立的。因此,如果一个 n × n n \times n n × n 矩阵的每个特征值都是单重的,那么 A \mathbf{A} A 的 n n n 个特征向量(每个特征值对应一个)是线性独立的。另一方面,如果 A \mathbf{A} A 有一个或多个重复特征值,则与 A \mathbf{A} A 相关的线性独立的特征向量可能少于 n n n 个,因为对于一个重复特征值,我们可能有 q < m q<m q < m 。正如我们将在 7.8 节中看到的,这个事实可能会在求解微分方程组时导致后续的复杂性。
例 5
求矩阵的特征值和特征向量
A = ( 0 1 1 1 0 1 1 1 0 ) (37) \mathbf{A}=\left(\begin{array}{lll}
0 & 1 & 1 \tag{37}\\
1 & 0 & 1 \\
1 & 1 & 0
\end{array}\right)
A = 0 1 1 1 0 1 1 1 0 ( 37 )
解:
特征值 λ \lambda λ 和特征向量 x \mathbf{x} x 满足方程 ( A − λ I ) x = 0 (\mathbf{A}-\lambda \mathbf{I}) \mathbf{x}=\mathbf{0} ( A − λ I ) x = 0 ,即
( − λ 1 1 1 − λ 1 1 1 − λ ) ( x 1 x 2 x 3 ) = ( 0 0 0 ) . (38) \left(\begin{array}{rrr}
-\lambda & 1 & 1 \tag{38}\\
1 & -\lambda & 1 \\
1 & 1 & -\lambda
\end{array}\right)\left(\begin{array}{l}
x_{1} \\
x_{2} \\
x_{3}
\end{array}\right)=\left(\begin{array}{l}
0 \\
0 \\
0
\end{array}\right) .
− λ 1 1 1 − λ 1 1 1 − λ x 1 x 2 x 3 = 0 0 0 . ( 38 )
特征值是方程的根
det ( A − λ I ) = ∣ − λ 1 1 1 − λ 1 1 1 − λ ∣ = − λ 3 + 3 λ + 2 = 0 (39) \operatorname{det}(\mathbf{A}-\lambda \mathbf{I})=\left|\begin{array}{rrr}
-\lambda & 1 & 1 \tag{39}\\
1 & -\lambda & 1 \\
1 & 1 & -\lambda
\end{array}\right|=-\lambda^{3}+3 \lambda+2=0
det ( A − λ I ) = − λ 1 1 1 − λ 1 1 1 − λ = − λ 3 + 3 λ + 2 = 0 ( 39 )
方程 (39) 的根是 λ 1 = 2 , λ 2 = − 1 \lambda_{1}=2, \lambda_{2}=-1 λ 1 = 2 , λ 2 = − 1 , 和 λ 3 = − 1 \lambda_{3}=-1 λ 3 = − 1 。因此 2 是一个单重特征值,而 -1 是一个代数重数为 2 的特征值,或者称为二重特征值。
为了找到与特征值 λ 1 \lambda_{1} λ 1 对应的特征向量 x ( 1 ) \mathbf{x}^{(1)} x ( 1 ) ,我们将 λ = 2 \lambda=2 λ = 2 代入方程 (38);这得到方程组
( − 2 1 1 1 − 2 1 1 1 − 2 ) ( x 1 x 2 x 3 ) = ( 0 0 0 ) . (40) \left(\begin{array}{rrr}
-2 & 1 & 1 \tag{40}\\
1 & -2 & 1 \\
1 & 1 & -2
\end{array}\right)\left(\begin{array}{l}
x_{1} \\
x_{2} \\
x_{3}
\end{array}\right)=\left(\begin{array}{l}
0 \\
0 \\
0
\end{array}\right) .
− 2 1 1 1 − 2 1 1 1 − 2 x 1 x 2 x 3 = 0 0 0 . ( 40 )
我们可以使用初等行变换将其化简为等价方程组
( 2 − 1 − 1 0 1 − 1 0 0 0 ) ( x 1 x 2 x 3 ) = ( 0 0 0 ) . (41) \left(\begin{array}{rrr}
2 & -1 & -1 \tag{41}\\
0 & 1 & -1 \\
0 & 0 & 0
\end{array}\right)\left(\begin{array}{l}
x_{1} \\
x_{2} \\
x_{3}
\end{array}\right)=\left(\begin{array}{l}
0 \\
0 \\
0
\end{array}\right) .
2 0 0 − 1 1 0 − 1 − 1 0 x 1 x 2 x 3 = 0 0 0 . ( 41 )
求解此方程组得到特征向量
x ( 1 ) = ( 1 1 1 ) (42) \mathbf{x}^{(1)}=\left(\begin{array}{l}
1 \tag{42}\\
1 \\
1
\end{array}\right)
x ( 1 ) = 1 1 1 ( 42 )
对于 λ = − 1 \lambda=-1 λ = − 1 ,方程 (38) 直接化简为单个方程
x 1 + x 2 + x 3 = 0 \begin{equation*}
x_{1}+x_{2}+x_{3}=0 \tag{43}
\end{equation*}
x 1 + x 2 + x 3 = 0 ( 43 )
因此,可以任意选择 x 1 , x 2 , x 3 x_{1}, x_{2}, x_{3} x 1 , x 2 , x 3 中任意两个量的值,第三个值由方程 (43) 确定。例如,如果 x 1 = c 1 x_{1}=c_{1} x 1 = c 1 且 x 2 = c 2 x_{2}=c_{2} x 2 = c 2 ,则 x 3 = − c 1 − c 2 x_{3}=-c_{1}-c_{2} x 3 = − c 1 − c 2 。用向量记法表示为
x = ( c 1 c 2 − c 1 − c 2 ) = c 1 ( 1 0 − 1 ) + c 2 ( 0 1 − 1 ) . (44) \mathbf{x}=\left(\begin{array}{c}
c_{1} \tag{44}\\
c_{2} \\
-c_{1}-c_{2}
\end{array}\right)=c_{1}\left(\begin{array}{r}
1 \\
0 \\
-1
\end{array}\right)+c_{2}\left(\begin{array}{r}
0 \\
1 \\
-1
\end{array}\right) .
x = c 1 c 2 − c 1 − c 2 = c 1 1 0 − 1 + c 2 0 1 − 1 . ( 44 )
例如,通过选择 c 1 = 1 c_{1}=1 c 1 = 1 和 c 2 = 0 c_{2}=0 c 2 = 0 ,我们得到特征向量
x ( 2 ) = ( 1 0 − 1 ) (45) \mathbf{x}^{(2)}=\left(\begin{array}{r}
1 \tag{45}\\
0 \\
-1
\end{array}\right)
x ( 2 ) = 1 0 − 1 ( 45 )
x ( 2 ) \mathbf{x}^{(2)} x ( 2 ) 的任何非零倍数也是一个特征向量,但通过对 c 1 c_{1} c 1 和 c 2 c_{2} c 2 进行其他选择——例如,c 1 = 0 c_{1}=0 c 1 = 0 且 c 2 = 1 c_{2}=1 c 2 = 1 ——可以找到第二个线性独立的特征向量。在这种情况下,我们得到
x ( 3 ) = ( 0 1 − 1 ) , (46) \mathbf{x}^{(3)}=\left(\begin{array}{r}
0 \tag{46}\\
1 \\
-1
\end{array}\right),
x ( 3 ) = 0 1 − 1 , ( 46 )
与 x ( 2 ) \mathbf{x}^{(2)} x ( 2 ) 线性无关。因此,在此例中,与该二重特征值关联着两个线性无关的特征向量。
一类重要的特殊矩阵,称为自伴随矩阵或厄米矩阵(Hermitian matrices),是指满足 A ∗ = A \mathbf{A}^{*}=\mathbf{A} A ∗ = A 的矩阵;也就是说,a ˉ j i = a i j \bar{a}_{j i}=a_{i j} a ˉ ji = a ij 。厄米矩阵包含一个子类,即实对称矩阵——具有实数元素且满足 A T = A \mathbf{A}^{T}=\mathbf{A} A T = A 的矩阵。厄米矩阵的特征值和特征向量总是具有以下有用的性质:
所有特征值都是实数。
总是存在一组完整的 n n n 个线性无关的特征向量,与特征值的代数重数无关。
如果 x ( 1 ) \mathbf{x}^{(1)} x ( 1 ) 和 x ( 2 ) \mathbf{x}^{(2)} x ( 2 ) 是对应于不同特征值的特征向量,则 ( x ( 1 ) , x ( 2 ) ) = 0 \left(\mathbf{x}^{(1)}, \mathbf{x}^{(2)}\right)=0 ( x ( 1 ) , x ( 2 ) ) = 0 。因此,如果所有特征值都是单重的,则相应的特征向量构成一组正交向量。
对于代数重数为 m m m 的特征值,可以选择 m m m 个相互正交的特征向量。因此,完整的 n n n 个特征向量总是可以选择为既正交又线性无关。
上述性质 1 和 3 的证明概要见问题 27 和 28。例 5 涉及一个实对称矩阵,并说明了性质 1、2 和 3,但我们对 x ( 2 ) \mathbf{x}^{(2)} x ( 2 ) 和 x ( 3 ) \mathbf{x}^{(3)} x ( 3 ) 的选择并未说明性质 4。然而,总是可以选择 x ( 2 ) \mathbf{x}^{(2)} x ( 2 ) 和 x ( 3 ) \mathbf{x}^{(3)} x ( 3 ) 使得 ( x ( 2 ) , x ( 3 ) ) = 0 \left(\mathbf{x}^{(2)}, \mathbf{x}^{(3)}\right)=0 ( x ( 2 ) , x ( 3 ) ) = 0 。例如,在例 5 中,我们可以像之前一样选择 x ( 2 ) \mathbf{x}^{(2)} x ( 2 ) ,并通过在方程 (46) 中使用 c 1 = 1 c_{1}=1 c 1 = 1 和 c 2 = − 2 c_{2}=-2 c 2 = − 2 来选择 x ( 3 ) \mathbf{x}^{(3)} x ( 3 ) 。以这种方式,我们得到
x ( 2 ) = ( 1 0 − 1 ) , x ( 3 ) = ( 1 − 2 1 ) \mathbf{x}^{(2)}=\left(\begin{array}{r}
1 \\
0 \\
-1
\end{array}\right), \quad \mathbf{x}^{(3)}=\left(\begin{array}{r}
1 \\
-2 \\
1
\end{array}\right)
x ( 2 ) = 1 0 − 1 , x ( 3 ) = 1 − 2 1
作为与特征值 λ = − 1 \lambda=-1 λ = − 1 关联的特征向量。这些特征向量相互正交,同时也与对应于特征值 λ = 2 \lambda=2 λ = 2 的特征向量 x ( 1 ) \mathbf{x}^{(1)} x ( 1 ) 正交。